Aquí podría ser tu PUBLICIDAD


Extracción de información de texto en Python

votos
-1

Soy nuevo en la minería de texto. Tengo un archivo CSV. Tengo que ir a través de cada línea y extraer alguna información luego escribir en otro archivo CSV. Busco información específica que tiene en un diccionario. Considere a continuación frase:

La versión de la aplicación es 1.8.2 y la variable de skt.len pasa la información requerida. Archivo readme.txt tiene las especificaciones.

Mi diccionario es: [ versión de la aplicación, variable, archivo]

Necesito extraer:

  • versión de la aplicación: 1.8.2
  • variables: skt.len
  • archivo: ReadMe.txt

¿Cuál es la mejor manera de extraer dicha información de texto? Estoy jugando con las características NLTK y StanfordCoreNLP. Sin embargo, no pude extraer la información aún. Me refiero a utilizar expresiones regulares para extraer la versión de la aplicación. ¿Alguna idea?

PS: Yo sé que esto puede hacer que la tarea más complicada. Pero, oraciones en cada línea del archivo CSV pueden tener estructuras diferentes. Por ejemplo: versión de la aplicación en una línea, que puede ser versión de la aplicación en otra línea. O archivo en una línea puede ser nombre de archivo en la otra línea.

Publicado el 02/09/2018 a las 05:25
fuente por usuario Mahhos
En otros idiomas...        العربية       


Aquí podría ser tu PUBLICIDAD