llm in-context recall (German translation)

1 month ago · 51811197b6
parent 8dcc7bffd6
commit 51811197b6
2 changed files with 27 additions and 0 deletions
--- a/pages/research/_meta.de.json
+++ b/pages/research/_meta.de.json
@ -2,6 +2,7 @@
    "llm-agents": "LLM Agenten",
    "rag": "RAG für LLMs",
    "llm-reasoning": "LLM Reasoning",
+    "llm-recall": "LLM In-Context Recall",
    "thoughtsculpt": "ThoughtSculpt",
    "infini-attention": "Infini-Attention",
    "trustworthiness-in-llms": "Vertrauenswürdigkeit in LLMs",
--- a/pages/research/llm-recall.de.mdx
+++ b/pages/research/llm-recall.de.mdx
@ -0,0 +1,26 @@
+# LLM In-Context Recall hängt vom Prompt ab
+
+import {Bleed} from 'nextra-theme-docs'
+
+<Bleed>
+  <iframe width="100%"
+    height="415px"
+    src="https://www.youtube.com/embed/2cNO76lIZ4s?si=tbbdo-vnr56YQ077" allow="accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture"
+    allowFullScreen
+    />
+</Bleed>
+
+Dieses neue [Paper von Machlab und Battle (2024)](https://arxiv.org/abs/2404.08865) analysiert die In-Context Recall-Leistung verschiedener LLMs anhand mehrerer Nadel-im-Heuhaufen-Tests.
+
+Es zeigt, dass verschiedene LLMs Fakten auf unterschiedlichen Längen und in verschiedener Tiefe erinnern. Es stellt fest, dass die Recall-Leistung eines Modells erheblich durch kleine Änderungen im Prompt beeinflusst wird.
+
+!["Needle In the HayStack Performance"](../../img/research/haystack-performance.png)
+*Quelle: [Machlab und Battle (2024)](https://arxiv.org/abs/2404.08865)*
+
+Darüber hinaus kann das Zusammenspiel zwischen Prompt-Inhalt und Trainingsdaten die Antwortqualität verschlechtern.
+
+Die Recall-Fähigkeit eines Modells kann durch Vergrößerung, Verbesserung des Attention-Mechanismus, das Ausprobieren verschiedener Trainingsstrategien und das Anwenden von Fine-Tuning verbessert werden.
+
+Wichtiger praktischer Tipp aus dem Paper: „Die fortlaufende Bewertung wird die Auswahl von LLMs für individuelle Anwendungsfälle weiter informieren, ihre Wirkung und Effizienz in realen Anwendungen maximieren, da die Technologie weiterhin fortschreitet.“
+
+Die wichtigsten Erkenntnisse aus diesem Paper sind die Bedeutung einer sorgfältigen Gestaltung des Prompts, die Einrichtung eines kontinuierlichen Bewertungsprotokolls und das Testen verschiedener Modellverbesserungsstrategien, um Recall und Nutzen zu verbessern.