Package Api Documentation for mlconjug

Referencia de API para las clases en mlconjug.mlconjug.py

Módulo principal MLConjug

Este módulo declara las principales clases con las que el usuario interactúa»
El módulo define las clases necesarias para interactuar con los modelos de Machine Learning»
mlconjug.mlconjug.extract_verb_features(verb, lang, ngram_range)[fuente]
Vectorizador personalizado optimizado para extraer las características de los verbos»
Las subclases Vectorizer sklearn.feature_extraction.text.CountVectorizer»
el vectorizador extrae las terminaciones de los verbos y produce una representación vectorial del verbo con características binarias
Para mejorar los resultados de la extracción de características, se han incluido varias otras características:
Las características son los n-gramas finales del verbo, los n-grams iniciales, la longitud del verbo, el número de vocales, el número de consonantes y la proporción de vocales sobre consonantes.
Parámetros:
  • verb – string. Verbo para vectorizar
  • lang – string. Idioma para analizar.
  • ngram_range – tupla El rango de la ventana deslizante ngram.
Devuelve:

list. Lista de las características más destacadas del verbo para la tarea de encontrar su clase de conjugación.

class mlconjug.mlconjug.Conjugator(language='fr', model=None)[fuente]
Esta es la clase principal del Proyecto.
La clase maneja el conjunto de datos Verbiste y proporciona una interfaz con el modelo scikit-learn.
Si no se proporcionan parámetros, el idioma predeterminado es francés y se utiliza el modelo de conjugación francés preentrenado.
La clase define el método conjugado (verbo, lenguaje) que es el método principal del modulo.
Parámetros:
  • language – string. Idioma del conjugador. El idioma predeterminado es “fr” para francés.
  • model – mlconjug.Model o scikit-learn Pipeline o Classifier implementando los métodos fit () y predict (). Un conducto proporcionado por el usuario si el usuario ha entrenado su propia tubería.
conjugate(verb, subject='abbrev')[fuente]
Este es el método principal de esta clase.
Primero verifica si el verbo está en Verbiste.
Si no es así, y se ha proporcionado un modelo de aprendizaje de scikit preentrenado, el método llama al modelo.
Devuelve un objeto Verb o Ninguno.
Parámetros:
  • verb – string. Verbo para conjugar.
  • subject – string. Alterna los pronombres abreviados o completos. El valor predeterminado es “abreviación”. Seleccione “pronombre” para los pronombres completos.
Devuelve:

Verb object or None.

set_model(model)[fuente]

Asigna el modelo de aprendizaje de scikit preentrenado provisto para poder conjugar verbos desconocidos.

Parámetros:model – scikit-learn Classifier o Pipeline»
class mlconjug.mlconjug.DataSet(verbs_dict)[fuente]
Esta clase contiene y administra el conjunto de datos»
Define funciones auxiliares para administrar tareas de Aprendizaje automático, como la construcción de un conjunto de entrenamiento y prueba.
Parámetros:verbs_dict – Un diccionario de verbos y su correspondiente clase de conjugación.
construct_dict_conjug()[fuente]
Rellena el diccionario que contiene las plantillas de conjugación.
Rellena las listas que contienen los verbos y sus plantillas.
split_data(threshold=8, proportion=0.5)[fuente]

Divide los datos en un conjunto de entrenamiento y prueba.

Parámetros:
  • threshold – int. Tamaño mínimo de la clase de conjugación que se dividirá.
  • proportion – float. Proporción de muestras en el conjunto de entrenamiento. Debe estar entre 0 y 1.
class mlconjug.mlconjug.Model(vectorizer=None, feature_selector=None, classifier=None, language=None)[fuente]

Bases:: clase:` objeto`

Esta clase maneja el modelo scikit-learn.
The Pipeline incluye un vectorizador de funciones, un selector de funciones y un clasificador»
El método __init__ proporcionará buenos valores predeterminados que obtienen más del 92% de precisión de predicción.
Parámetros:
  • vectorizer – scikit-learn Vectorizer»
  • feature_selector – clasificador scikit-learn con un método fit_transform ()
  • classifier – clasificador scikit-learn con un método de predicción ()
  • language – lenguaje del corpus de verbos a analizar.
train(samples, labels)[fuente]

Entrena el modelo en las muestras y etiquetas suministradas.

Parámetros:
  • samples – lista. Lista de verbos.
  • labels – lista. Lista de plantillas de verbos.
predict(verbs)[fuente]

Predice la clase de conjugación de la lista de verbos proporcionada.

Parámetros:verbs – lista. Lista de verbos.
Devuelve:lista. Lista de grupos de conjugación predichos.

Referencia de API para las clases en mlconjug.PyVerbiste.py

PyVerbiste.

Una biblioteca de Python para conjugar verbos en francés, inglés, español, italiano, portugués y rumano (más pronto).
Contiene datos de conjugación generados por modelos de aprendizaje automático utilizando la biblioteca de python mlconjug.
Más información sobre mlconjug en https://pypi.org/project/mlconjug/
Los datos de conjugación se ajustan al esquema XML definido por Verbiste.
class mlconjug.PyVerbiste.ConjugManager(language='default')[fuente]

Esta es la clase que maneja los archivos json.

Parámetros:language – string. | Idioma del conjugador. El idioma predeterminado es “fr” para francés.
_load_verbs(verbs_file)[fuente]

Cargar y analizar los verbos del archivo json.

Parámetros:verbs_file – string o objeto de ruta. Ruta al archivo json de verbos.
_load_conjugations(conjugations_file)[fuente]

Cargar y analizar las conjugaciones del archivo json.

Parámetros:conjugations_file – string o objeto de ruta. Ruta al archivo xml de conjugación
_detect_allowed_endings()[fuente]
Detecta las terminaciones permitidas para los verbos en los idiomas admitidos
Todos los idiomas admitidos, excepto el inglés, restringen la forma que puede adoptar un verbo
Como el inglés es mucho más productivo y variado en la morfología de sus verbos, cualquier palabra se permite como verbo
Devuelve:set. Un conjunto que contiene las terminaciones permitidas de los verbos en el idioma de destino
is_valid_verb(verb)[fuente]
Comprueba si el verbo es un verbo válido en el idioma dado.
Las palabras en inglés siempre se tratan como posibles verbos.
Los verbos en otros idiomas se filtran por sus terminaciones.
Parámetros:verb – string. El verbo conjugar
Devuelve:bool. Verdadero si el verbo es un verbo válido en el idioma. De lo contrario, falso»
get_verb_info(verb)[fuente]

Obtiene información del verbo y devuelve una instancia de VerbInfo»

Parámetros:verb – string. Verbo para conjugar.
Devuelve:Objeto VerbInfo o Ninguno»
get_conjug_info(template)[fuente]

Obtiene la información de conjugación correspondiente a la plantilla dada»

Parámetros:template – string. Nombre del patrón de terminación del verbo»
Devuelve:OrderedDict or None. OrderedDict que contiene los sufijos conjugados de la plantilla»
class mlconjug.PyVerbiste.Verbiste(language='default')[fuente]

Bases: mlconjug.PyVerbiste.ConjugManager

Esta es la clase que maneja los archivos Verbiste xml»

Parámetros:language – string. | Idioma del conjugador. El idioma predeterminado es “fr” para francés.
_load_verbs(verbs_file)[fuente]

Cargar y analizar los verbos del archivo xml»

Parámetros:verbs_file – cadena o objeto de ruta. Ruta al archivo xml de verbos»
_parse_verbs(file)[fuente]

Analiza el archivo XML»

Parámetros:file – FileObject. Archivo XML que contiene los verbos»
Devuelve:OrderedDict. Un OrderedDict que contiene el verbo y su plantilla para todos los verbos en el archivo»
_load_conjugations(conjugations_file)[fuente]

Cargar y analizar las conjugaciones del archivo json.

Parámetros:conjugations_file – string o objeto de ruta. Ruta al archivo xml de conjugación
_parse_conjugations(file)[fuente]

Analiza el archivo XML»

Parámetros:file – FileObject. Archivo XML que contiene las plantillas de conjugación»
Devuelve:OrderedDict. Un OrderedDict que contiene todas las plantillas de conjugación en el archivo»
_load_tense(tense)[fuente]

Cargar y analizar las formas del tiempo inflexión del archivo xml»

Parámetros:tense – lista de etiquetas xml que contienen formas flexionadas La lista de formas declinadas para el tiempo actual que se está procesando.
Devuelve:lista. Lista de formas declinadas.
_detect_allowed_endings()
Detecta las terminaciones permitidas para los verbos en los idiomas admitidos
Todos los idiomas admitidos, excepto el inglés, restringen la forma que puede adoptar un verbo
Como el inglés es mucho más productivo y variado en la morfología de sus verbos, cualquier palabra se permite como verbo
Devuelve:set. Un conjunto que contiene las terminaciones permitidas de los verbos en el idioma de destino
get_conjug_info(template)

Obtiene la información de conjugación correspondiente a la plantilla dada»

Parámetros:template – string. Nombre del patrón de terminación del verbo»
Devuelve:OrderedDict or None. OrderedDict que contiene los sufijos conjugados de la plantilla»
get_verb_info(verb)

Obtiene información del verbo y devuelve una instancia de VerbInfo»

Parámetros:verb – string. Verbo para conjugar.
Devuelve:Objeto VerbInfo o Ninguno»
is_valid_verb(verb)
Comprueba si el verbo es un verbo válido en el idioma dado.
Las palabras en inglés siempre se tratan como posibles verbos.
Los verbos en otros idiomas se filtran por sus terminaciones.
Parámetros:verb – string. El verbo conjugar
Devuelve:bool. Verdadero si el verbo es un verbo válido en el idioma. De lo contrario, falso»
class mlconjug.PyVerbiste.VerbInfo(infinitive, root, template)[fuente]

Esta clase define la estructura de información del verbo Verbiste»

Parámetros:
  • infinitive – cadena. Forma infinitiva del verbo»
  • root – cadena. Raíz léxica del verbo»
  • template – string. Nombre del patrón de terminación del verbo»
class mlconjug.PyVerbiste.Verb(verb_info, conjug_info, subject='abbrev', predicted=False)[fuente]

This class defines the Verb Object. TODO: Make the conjugated forms iterable by implementing the iterator protocol.

Parámetros:
  • verb_info – Objeto VerbInfo»
  • conjug_info – OrderedDict»
  • subject – string. Alterna los pronombres abreviados o completos. El valor predeterminado es “abreviación”. Seleccione “pronombre” para los pronombres completos.
  • predicted – bool. Indica si la información de conjugación fue predicha por el modelo o recuperada del conjunto de datos.
iterate()[fuente]

Iterates over all conjugated forms and returns a list of tuples of those conjugated forms. :return:

_load_conjug()[fuente]
Rellena las formas flexionadas del verbo»
Esta es la versión genérica de este método»
No agrega pronombres personales a las formas conjugadas»
Este método puede manejar cualquier idioma nuevo si la estructura de conjugación se ajusta al esquema XML de Verbiste»
class mlconjug.PyVerbiste.VerbFr(verb_info, conjug_info, subject='abbrev', predicted=False)[fuente]

Bases:: clase:` mlconjug.PyVerbiste.Verb`

Esta clase define el objeto del verbo francés»

_load_conjug()[fuente]
Rellena las formas flexionadas del verbo»
Agrega pronombres personales a los verbos inflexionados»
iterate()

Iterates over all conjugated forms and returns a list of tuples of those conjugated forms. :return:

class mlconjug.PyVerbiste.VerbEn(verb_info, conjug_info, subject='abbrev', predicted=False)[fuente]

Bases:: clase:` mlconjug.PyVerbiste.Verb`

Esta clase define el objeto del verbo inglés»

_load_conjug()[fuente]
Rellena las formas flexionadas del verbo»
Agrega pronombres personales a los verbos inflexionados»
iterate()

Iterates over all conjugated forms and returns a list of tuples of those conjugated forms. :return:

class mlconjug.PyVerbiste.VerbEs(verb_info, conjug_info, subject='abbrev', predicted=False)[fuente]

Bases:: clase:` mlconjug.PyVerbiste.Verb`

Esta clase define el objeto del verbo español»

_load_conjug()[fuente]
Rellena las formas flexionadas del verbo»
Agrega pronombres personales a los verbos inflexionados»
iterate()

Iterates over all conjugated forms and returns a list of tuples of those conjugated forms. :return:

class mlconjug.PyVerbiste.VerbIt(verb_info, conjug_info, subject='abbrev', predicted=False)[fuente]

Bases:: clase:` mlconjug.PyVerbiste.Verb`

Esta clase define el objeto del verbo italiano»

_load_conjug()[fuente]
Rellena las formas flexionadas del verbo»
Agrega pronombres personales a los verbos inflexionados»
iterate()

Iterates over all conjugated forms and returns a list of tuples of those conjugated forms. :return:

class mlconjug.PyVerbiste.VerbPt(verb_info, conjug_info, subject='abbrev', predicted=False)[fuente]

Bases:: clase:` mlconjug.PyVerbiste.Verb`

Esta clase define el objeto del verbo portugués»

_load_conjug()[fuente]
Rellena las formas flexionadas del verbo»
Agrega pronombres personales a los verbos inflexionados»
iterate()

Iterates over all conjugated forms and returns a list of tuples of those conjugated forms. :return:

class mlconjug.PyVerbiste.VerbRo(verb_info, conjug_info, subject='abbrev', predicted=False)[fuente]

Bases:: clase:` mlconjug.PyVerbiste.Verb`

Esta clase define el objeto del verbo rumano»

iterate()

Iterates over all conjugated forms and returns a list of tuples of those conjugated forms. :return:

_load_conjug()[fuente]
Rellena las formas flexionadas del verbo»
Agrega pronombres personales a los verbos inflexionados»