Bibliographie MLOps, NLP, GLiNER, GLiREL, LangChain, Docling v2¶
Docling v2¶
-
Docling v2 : Préparez vos documents pour l'IA générative
Docling v2 Documentation
Présentation des fonctionnalités et améliorations de Docling v2, outil de préparation de documents pour l'IA générative. -
Dépôt GitHub de Docling v2
GitHub - dsrdatta/docling_v2
Code source et documentation de Docling v2.
Docling: A Versatile Document Parsing Tool - Medium
Building Document Parsing Pipelines with Python - Medium¶
GLiNER et GLiREL (NER et Extraction de Relations)¶
GLiNER : Generalist and Lightweight Model for Named Entity Recognition¶
-
Article GLiNER :
Urchade Zaratiana, Nadi Tomeh, Pierre Holat, Thierry Charnois
arXiv:2311.08526
Présentation d’un modèle généraliste et léger pour la reconnaissance d'entités nommées. -
Dépôt GitHub de GLiNER
GitHub - urchade/GLiNER
Code source, modèles pré-entraînés et exemples d'utilisation. -
Google Colab - "GLiNER-Studio" by Knowledgator Gliner_Studio.ipynb
GLiREL : Generalist and Lightweight Model for Relation Extraction¶
-
Dépôt GitHub de GLiREL
GitHub - jackboyla/GLiREL
Code source, modèles pré-entraînés et exemples d'utilisation d'un modèle généraliste et léger pour l'extraction de relations. -
"GLiNER : le succès du modèle de reconnaissance d'entités nommées par F.initiatives" Le modèle GLiNER par F.initiatives
Intégration GLiNER / GLiREL avec LangChain¶
-
GlinerGraphTransformer
LangChain Documentation
Permet de convertir des documents en graphes via GLiNER/GLiREL. -
GLiNERLinkExtractor
LangChain Documentation
Extracteur de liens entre documents partageant des entités nommées.
Deep Dive "sous le capot" du modèle - Medium¶
GLiNER: A Zero-Shot NER that outperforms ChatGPT and traditional NER models
Understanting PII Anonymization
Semantic Chunking for RAG - Medium
Introducing GraphRAG with LangChain and Neo4j
How to Run Llama 3.2-Vision Locally With Ollama: A Game Changer for Edge AI¶
MLflow Tracking Server MLflow (2.17.2) Model Registry
Docker, FastAPI, et Configurations Réseau¶
- Setting Up FastAPI
- Docker Networking Simplified
- MinIO with Traefik
- Securing FastAPI with OAuth2
- Traefik Documentation
- PostgreSQL in Docker Containers
- Cloudflared
Embeddings, LangChain, Ollama et Outils ML¶
LangChain¶
- LangChain Documentation
- LangChain API Reference
- Chaining LLMs with LangChain
- LangChain for Large Language Models (Medium)
- Wikipedia - LangChain
Label Studio et Traitement de Documents¶
- Label Studio Official Documentation
- Building Annotation Interfaces with Label Studio
- Integrating Label Studio with FastAPI (GitHub)
- PostgreSQL and Label Studio Integration
- Using Label Studio for Document Processing
- JSON, YAML, and Markdown in Document Workflows
- Multi-Format Document Handling with Python