Skip to content

Bibliographie MLOps, NLP, GLiNER, GLiREL, LangChain, Docling v2


Docling v2

  • Docling v2 : Préparez vos documents pour l'IA générative
    Docling v2 Documentation
    Présentation des fonctionnalités et améliorations de Docling v2, outil de préparation de documents pour l'IA générative.

  • Dépôt GitHub de Docling v2
    GitHub - dsrdatta/docling_v2
    Code source et documentation de Docling v2.

Docling: A Versatile Document Parsing Tool - Medium

Building Document Parsing Pipelines with Python - Medium

GLiNER et GLiREL (NER et Extraction de Relations)

GLiNER : Generalist and Lightweight Model for Named Entity Recognition

GLiREL : Generalist and Lightweight Model for Relation Extraction

  • Dépôt GitHub de GLiREL
    GitHub - jackboyla/GLiREL
    Code source, modèles pré-entraînés et exemples d'utilisation d'un modèle généraliste et léger pour l'extraction de relations.

  • "GLiNER : le succès du modèle de reconnaissance d'entités nommées par F.initiatives" Le modèle GLiNER par F.initiatives

Intégration GLiNER / GLiREL avec LangChain

Deep Dive "sous le capot" du modèle - Medium

Enhancing Retrieval-Augmented Generation: Tackling Polysemy, Homonyms and Entity Ambiguity with GLiNER for Improved Performance

GLiNER: A Zero-Shot NER that outperforms ChatGPT and traditional NER models

Understanting PII Anonymization

Semantic Chunking for RAG - Medium

Introducing GraphRAG with LangChain and Neo4j

Setup collaborative MLflow with PostgreSQL as Tracking Server and MinIO as Artifact Store using docker containers

How to Run Llama 3.2-Vision Locally With Ollama: A Game Changer for Edge AI

MLflow Tracking Server MLflow (2.17.2) Model Registry

Docker, FastAPI, et Configurations Réseau

  1. Setting Up FastAPI
  2. Docker Networking Simplified
  3. MinIO with Traefik
  4. Securing FastAPI with OAuth2
  5. Traefik Documentation
  6. PostgreSQL in Docker Containers
  7. Cloudflared

Embeddings, LangChain, Ollama et Outils ML

  1. Generating Embeddings with Ollama
  2. Using Hugging Face Models for Embedding Tasks

LangChain

  1. LangChain Documentation
  2. LangChain API Reference
  3. Chaining LLMs with LangChain
  4. LangChain for Large Language Models (Medium)
  5. Wikipedia - LangChain

Label Studio et Traitement de Documents

  1. Label Studio Official Documentation
  2. Building Annotation Interfaces with Label Studio
  3. Integrating Label Studio with FastAPI (GitHub)
  4. PostgreSQL and Label Studio Integration
  5. Using Label Studio for Document Processing
  6. JSON, YAML, and Markdown in Document Workflows
  7. Multi-Format Document Handling with Python