Információgyűjtési módszerek
A Guru a válaszadás során több forrásból, több módon gyűjt információkat, esetleg rendezi azokat. Az itt található szócikkek az elemi információgyűjtési módszereket, algoritmusokat írják le megvalósítás szintjén. Igyekszünk az itt található információt a pontos feladatdefiníciók technikai részletek szintjén tartani, hiszen a módszerek koncepcionális működését, illetve a feladat legáltalánosabb leírását az információgyűjtés koncepcióoldalak tartalmazzák.Természetesen adott szócikkben megemlítjük a hozzá tartozó koncepcióoldalt.
Fontos kihangsúlyozni azt is, hogy az itt található algoritmusok az elemi módszereink, azaz azok a szubrutinok, melyeket a komplexebb információgyűjtési módszerek meghívnak, és eredményeiket összesítik valamilyen formában (jelenleg ez kimerül a válaszadási QA ág Data Collection lépésében).
Végül áttekintési célból felírjuk az egyes módszereket egy-egy felületes leírással.
| Módszer | Leírás |
|---|---|
| Predefined QA Search | Keresés egy előre meghatározott kérdés-válasz adatbázisban, olyan kérdésekre választ adva, melyekre a többi rendszer kevésbé tud. |
| Keyword Search | Keresés BM25 algoritmus segítségével, a szavakra és szókapcsolatokra koncentrálva. |
| Semantic Search | Keresés szemantikus beágyazások segítségével, bi-encoder eljárással. |
| Reranking | Találatok átrendezése cross-encoder eljárással. |