SpaCy: Industrial-Strength Natural Language Processing (NLP) in Python
spaCy — промышленная библиотека NLP на Python.
Быстрая, точная, поддерживает 70+ языков.
Основное
- Установка
pip install -U spacy python -m spacy download en_core_web_sm - Быстрый старт
import spacy nlp = spacy.load("en_core_web_sm") doc = nlp("Apple is looking at buying U.K. startup for $1 billion") for ent in doc.ents: print(ent.text, ent.label_)
Возможности
- токенизация, POS-теги, синтаксис, NER
- готовые модели CNN/Transformer
- обучение и дообучение
- интеграция с PyTorch, Transformers, FastAPI
- GPU/Apple Metal
Примеры
- NER: выделение имён, дат, денег
- Matcher: поиск паттернов
- Projects: end-to-end пайплайны
- spaCy LLM: LLM-интеграция без кода