PK 7|BLO@ O@ pymorphy2-0.3.2/index.html
pymorphy2 написан на языке Python (работает под 2.x и 3.x). Он умеет:
При работе используется словарь OpenCorpora; для незнакомых слов строятся гипотезы. Библиотека достаточно быстрая: в настоящий момент скорость работы - от нескольких тыс слов/сек до > 100тыс слов/сек (в зависимости от выполняемой операции, интерпретатора и установленных пакетов); потребление памяти - 10...20Мб; полностью поддерживается буква ё.
Лицензия - MIT.
Исходный код - на github или bitbucket. Если заметили ошибку, то пишите в баг-трекер. Для обсуждения есть гугл-группа; если есть какие-то вопросы - пишите туда.
Для выполнения поиска необходима поддержка JavaScript в браузере.
Эта форма предназначена для поиска по всем разделам настоящей документации. Введите искомые слова в текстовое поле и нажмите кнопку «искать». Обратите внимание: найдены будут только те страницы, в которых упомянуты все указанные слова. Страницы, в которых встречается только часть этих слов, отобраны не будут.
Значение какой-либо грамматической характеристики слова. Например, “множественное число” или “деепричастие”. Множество всех граммем, характеризующих данное слово, образует тег.
См. также: Обозначения для граммем.
Образец для склонения или спряжения; правила, согласно которым можно получить все формы слов в лексеме для данного стема.
В pymorphy2 для каждого слова в словаре указано, по каким парадигмам это слово могло быть образовано; pymorphy2 также умеет предсказывать парадигму для слов, отсутствующих в словаре.
[1] | Часто не делается различия между леммой и лексемой, или термин “лемма” употребляется в значении “набор форм слова”. Но, похоже, данное выше определение лексемы все же более стандартное (см., например, см. википедию или Foundations of Statistical Natural Language Processing), поэтому в pymorphy2 набор всех форм слова называется именно лексемой. |
[2] | В pymorphy1 и в XML-словаре из OpenCorpora слово “лемма” употребляется в значении “лексема”. Чтобы не усугублять путаницу, в pymorphy2 вместо термина “лемма” употребляется термин “нормальная форма слова”, а термин “лемма” не используется совсем. |