Jak vytvořit systém RAG v Make.com

Jak vytvořit systém RAG v make.com

Retrieval Augmented Generation (RAG) je často využívaný vzor při vytváření AI automatizací a aplikací. Tento článek vám ukáže, jak si vlastní RAG systém vytvořit.

Co je RAG a proč je užitečný?

  • Definice: RAG (rozšířené generování vyhledáváním) umožňuje velkým jazykovým modelům (LLM) odkazovat na externí informace.
  • Proč jej potřebujeme?
    • Kontextová okna jazykových modelů, jako je chat GPT, mají omezenou kapacitu.
    • Například jedno nebo dvě PDF mohou být zpracovány přímo, ale 100 nebo 200 souborů už ne.
  • Princip fungování:
    • Dokumenty jsou rozděleny na menší části (chunky), které se přemění na vektory (embeddingy).
    • Při dotazu se vyhledají pouze relevantní chunky, které se přidají do vstupu modelu.

Kdy použít RAG?

  1. Otázky a odpovědi:
  2. Chat s PDF:
    • Umožňuje interakci s obsahem PDF bez nutnosti číst celý dokument.
    • Malá PDF mohou být zpracována přímo, ale větší dokumenty vyžadují RAG.
  3. Další výhody:
    • Snižuje náklady (méně tokenů).
    • Zkracuje dobu odezvy modelu (nižší latence).

Postup vytvoření systému RAG v make.com

  1. Příprava znalostní báze
    • Vyberte dokumenty, které chcete zahrnout (např. PDF „AI Automation at Work“ od McKinsey).
    • Použijte nástroj Dumpling AI:
      • Vytvořte novou znalostní bázi (např. „Automation Resources“).
      • Nahrajte PDF, které Dumpling AI rozdělí na chunky a vytvoří embeddingy.
    • Otestujte znalostní bázi dotazem, např. „Jaké je pořadí USA v investicích do AI?“
  2. Vyhledání relevantních chunků v make.com
    • Použijte modul „Search Knowledgebase“:
      • Zadejte ID znalostní báze a vyhledávací dotaz.
      • Nastavte počet výsledků (např. 5).
      • Modul vrátí chunky s hodnocením relevance.
  3. Generování odpovědi pomocí LLM
    • Předejte chunky a otázku do jazykového modelu (např. GPT).
    • Použijte modul pro chat completion:
      • Agregujte chunky do textového řetězce.
      • Vytvořte promyšlený systémový prompt (např. „Odpověz na otázku na základě poskytnutých referencí“).
      • Vstupy propojte s modulem a spusťte generování odpovědi.
  4. Vytvoření interaktivního front-endu (volitelné)
    • Chat s PDF přes e-mail:
      • Nastavte e-mailový háček, který aktivuje automatizaci při přijetí e-mailu.
      • Aktualizujte dotaz a vstupy podle obsahu e-mailu.
      • Odpověď modelu odešlete zpět uživateli.

Další využití RAG

  • Obsahová tvorba:
    • Umožňuje nový obsah navázat na stávající znalosti (např. u blogů).
  • Marketing:
    • Efektivní využití existujícího obsahu pro generování nových kampaní.

Tento přístup nejen usnadňuje práci s velkými objemy dat, ale také optimalizuje náklady a výkon. Prozkoumejte další automatizační scénáře v Make.com pro pokročilé využití. Máte-li jakékoli dotazy, zanechte je v komentářích.

Princip RAG (Retrieval-Augmented Generation)

Architektura na obrázku znázorňuje systém, který nekombinuje pouze naučené znalosti modelu, ale aktivně si vyhledává externí informace pro zpřesnění odpovědi. Celý proces probíhá v několika fázích:


1. Vstupní dotaz (Query x)

Proces začíná uživatelským vstupem (x). Schéma uvádí tři různé scénáře použití:

  • Zodpovídání otázek: Např. „Definujte střední ucho“.
  • Ověřování faktů: Ověření pravdivosti tvrzení o Baraccu Obamovi.
  • Generování otázek (Jeopardy): Vytvoření kontextu k odpovědi „Božská komedie“.

2. Vyhledávací modul (Retrieval – pη)

Tato část (zeleně orámovaná) funguje jako „knihovník“, který hledá podklady v externí databázi:

  • Query Encoder (q): Převede textový dotaz na číselnou reprezentaci (vektor).
  • MIPS (Maximum Inner Product Search): Algoritmus, který v indexu dokumentů hledá ty pasáže, které jsou matematicky nejblíže zadanému dotazu.
  • Index dokumentů d(z): Rozsáhlá báze znalostí (např. Wikipedia), ze které se vybírají relevantní dokumenty z.

3. Generativní modul (Generation – pθ)

Tato část (modře orámovaná) zpracovává nalezené informace:

  • Generátor: Parametrický model (typu seq2seq), který dostane na vstup jak původní dotaz (x), tak nalezené dokumenty (z).
  • Marginalizace: Model vyhodnotí více nalezených dokumentů současně a spojí jejich informace tak, aby vytvořil co nejrelevantnější výstup.

4. Výstupní odpověď (Output y)

Výsledkem je text (y), který kombinuje kreativitu generativního modelu s faktickou přesností dohledaných dat. Na schématu vidíme, že systém dokázal správně popsat části středního ucha nebo rozdělení Božské komedie díky tomu, že si tyto informace „přečetl“ v indexu.


Klíčový mechanismus: End-to-End trénování

V horní části diagramu je šipka Zpětná propagace (Backpropagation). To je zásadní prvek: systém není statický. Pokud je výsledná odpověď chybná, chyba se propíše zpět nejen do generátoru, ale i do vyhledávače (kodéru dotazů). Tím se systém učí v čase lépe vybírat ty správné dokumenty pro dané typy otázek.

Vladimír Matula

Vladimír Matula se v digitálním marketingu pohybuje od roku 2008. Svou expertízu staví na pevných základech z předních českých agentur, kde se specializoval na tvorbu webů, ecommerce, SEO a webovou analytiku. V roce 2012 založil marketingovou agenturu DIVERSITY PROMOTION s.r.o., kde nabízí online marketingové služby, tvorbu webů na WordPress, tvorbu eshopů na platformě Shoptet, Web design a AI marketing. Generativní AI integruje do klíčových procesů – od hloubkové analýzy dat, SEO a konverzního copywritingu podle ověřených vzorců až po automatizaci rutinních úkolů, které přináší úsporu času a vyšší kvalitu výstupů nejen jemu, ale i jeho klientům.