{"id":847,"date":"2025-10-31T16:31:02","date_gmt":"2025-10-31T15:31:02","guid":{"rendered":"https:\/\/konstantin.filtschew.de\/blog\/?p=847"},"modified":"2025-11-30T16:54:02","modified_gmt":"2025-11-30T15:54:02","slug":"chunking-in-rag-warum-die-groesse-doch-zaehlt","status":"publish","type":"post","link":"https:\/\/konstantin.filtschew.de\/blog\/2025\/10\/31\/chunking-in-rag-warum-die-groesse-doch-zaehlt\/","title":{"rendered":"Chunking in RAG \u2013 Warum die Gr\u00f6\u00dfe (doch) z\u00e4hlt"},"content":{"rendered":"\n<p>Ihr habt euch also entschieden, ein RAG-System aufzubauen. Gl\u00fcckwunsch! Ihr habt eure 500 Seiten Dokumentation digitalisiert, in PDFs konvertiert und seid bereit, die KI-Revolution zu starten. Dann kommt dieser eine Moment, wo jemand fragt: \u201eWie gro\u00df sollen denn die Chunks sein?&#8220;<\/p>\n\n\n\n<blockquote class=\"wp-block-quote is-layout-flow wp-block-quote-is-layout-flow\">\n<p><strong>Hinweis:<\/strong> Dieser Artikel baut auf dem RAG-Artikel auf: <a href=\"\/blog\/2025\/10\/08\/die-revolution-der-dokumentationszugaenglichkeit-wenn-dein-handbuch-ploetzlich-mit-dir-plaudert\/\">Die Revolution der Dokumentationszug\u00e4nglichkeit \u2013 Wenn dein Handbuch pl\u00f6tzlich mit dir plaudert<\/a><\/p>\n<\/blockquote>\n\n\n\n<p>Und pl\u00f6tzlich starrt ihr auf euren Bildschirm wie ein Reh im Scheinwerferlicht. 100 W\u00f6rter? 500? Ganze Abs\u00e4tze? Einzelne S\u00e4tze? Warum ist das \u00fcberhaupt wichtig?<\/p>\n\n\n\n<p><strong>Spoiler Alert:<\/strong> Es ist verdammt wichtig. Und zwar so wichtig, dass es den Unterschied zwischen \u201eWow, das funktioniert ja perfekt!&#8220; und \u201eWarum antwortet die KI mit komplettem Unsinn?&#8220; ausmachen kann.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">Was zum Teufel ist Chunking \u00fcberhaupt?<\/h2>\n\n\n\n<p>Stellt euch vor, ihr m\u00fcsst einem Freund ein 300-Seiten-Buch erkl\u00e4ren. Ihr w\u00fcrdet ihm nicht das komplette Buch auf einmal vorlesen, oder? Ihr w\u00fcrdet die wichtigsten Teile heraussuchen, in verdauliche Happen aufteilen und genau das erz\u00e4hlen, was f\u00fcr seine Frage relevant ist.<\/p>\n\n\n\n<p>Genau das macht Chunking. Eure Dokumente werden in kleinere Textbl\u00f6cke aufgeteilt, die:<\/p>\n\n\n\n<ul class=\"wp-block-list\">\n<li>Klein genug sind, um spezifisch zu sein<\/li>\n\n\n\n<li>Gro\u00df genug, um noch Sinn zu ergeben<\/li>\n\n\n\n<li>Klug genug aufgeteilt, um Kontext zu bewahren<\/li>\n\n\n\n<li>Durchsuchbar genug, um gefunden zu werden<\/li>\n<\/ul>\n\n\n\n<p>Klingt einfach? Ha! Willkommen in der wunderbaren Welt der Trade-offs.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">Das Goldilocks-Problem \u2013 Nicht zu gro\u00df, nicht zu klein<\/h2>\n\n\n\n<h3 class=\"wp-block-heading\">Zu gro\u00dfe Chunks (1000+ W\u00f6rter)<\/h3>\n\n\n\n<p>Ihr kennt das: Ihr fragt die KI \u201eWie beantrage ich Urlaub?&#8220; und bekommt als Antwort einen Roman \u00fcber HR-Prozesse, Betriebsvereinbarungen, Urlaubsanspr\u00fcche, Krankheitstage, \u00dcberstundenregelungen und die Geschichte eures Unternehmens seit 1987.<\/p>\n\n\n\n<p><strong>Das Problem:<\/strong><\/p>\n\n\n\n<ul class=\"wp-block-list\">\n<li>Die KI bekommt zu viel irrelevante Information<\/li>\n\n\n\n<li>Die Antwort wird schwammig und generisch<\/li>\n\n\n\n<li>Die wirklich wichtige Info geht im Rauschen unter<\/li>\n\n\n\n<li>Eure Kosten explodieren (mehr Tokens = mehr Geld)<\/li>\n<\/ul>\n\n\n\n<p><strong>Wann sinnvoll:<\/strong><\/p>\n\n\n\n<ul class=\"wp-block-list\">\n<li>Bei komplexen Themen, die viel Kontext brauchen<\/li>\n\n\n\n<li>Bei technischen Anleitungen mit vielen Abh\u00e4ngigkeiten<\/li>\n\n\n\n<li>Wenn ihr mehr Wert auf Vollst\u00e4ndigkeit als Pr\u00e4zision legt<\/li>\n<\/ul>\n\n\n\n<h3 class=\"wp-block-heading\">Zu kleine Chunks (50-100 W\u00f6rter)<\/h3>\n\n\n\n<p>Jetzt geht ihr in die andere Richtung. Einzelne S\u00e4tze, kurze Abs\u00e4tze. Super pr\u00e4zise! Bis die KI antwortet: \u201eLaut Dokument musst du das Formular ausf\u00fcllen&#8220; \u2013 aber welches Formular? Wo finde ich das? Was kommt danach?<\/p>\n\n\n\n<p><strong>Das Problem:<\/strong><\/p>\n\n\n\n<ul class=\"wp-block-list\">\n<li>Kontext geht verloren<\/li>\n\n\n\n<li>Zusammenh\u00e4nge werden zerrissen<\/li>\n\n\n\n<li>Die KI muss raten, was gemeint ist<\/li>\n\n\n\n<li>Referenzen und Bez\u00fcge funktionieren nicht mehr<\/li>\n<\/ul>\n\n\n\n<p><strong>Wann sinnvoll:<\/strong><\/p>\n\n\n\n<ul class=\"wp-block-list\">\n<li>Bei FAQ-artigen Dokumenten<\/li>\n\n\n\n<li>Bei Listen und Aufz\u00e4hlungen<\/li>\n\n\n\n<li>Wenn ihr sehr spezifische, kurze Antworten braucht<\/li>\n<\/ul>\n\n\n\n<h3 class=\"wp-block-heading\">Die goldene Mitte (200-500 W\u00f6rter)<\/h3>\n\n\n\n<p>F\u00fcr die meisten Anwendungen ist das der Sweet Spot. Genug Kontext, um sinnvolle Antworten zu geben, aber nicht so viel, dass die KI den \u00dcberblick verliert.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">Die verschiedenen Chunking-Strategien \u2013 Weil&#8217;s nat\u00fcrlich nicht nur eine gibt<\/h2>\n\n\n\n<h3 class=\"wp-block-heading\">1. Fixed-Size Chunking \u2013 Die Brechstange<\/h3>\n\n\n\n<p>\u201eAlle 300 W\u00f6rter, zack, neuer Chunk. Egal, ob&#8217;s gerade mitten im Satz ist.&#8220;<\/p>\n\n\n\n<p><strong>Vorteile:<\/strong><\/p>\n\n\n\n<ul class=\"wp-block-list\">\n<li>Super einfach zu implementieren<\/li>\n\n\n\n<li>Gleichm\u00e4\u00dfige Verteilung<\/li>\n\n\n\n<li>Vorhersagbare Performance<\/li>\n<\/ul>\n\n\n\n<p><strong>Nachteile:<\/strong><\/p>\n\n\n\n<ul class=\"wp-block-list\">\n<li>Zerrei\u00dft S\u00e4tze und Abs\u00e4tze<\/li>\n\n\n\n<li>Ignoriert nat\u00fcrliche Strukturen<\/li>\n\n\n\n<li>Kontextverlust garantiert<\/li>\n<\/ul>\n\n\n\n<p><strong>Fazit:<\/strong> Funktioniert f\u00fcr&#8217;s erste Prototyping, aber ihr werdet damit nicht gl\u00fccklich.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\">2. Semantic Chunking \u2013 Die elegante L\u00f6sung<\/h3>\n\n\n\n<p>\u201eLass uns die Bedeutung verstehen und danach aufteilen.&#8220;<\/p>\n\n\n\n<p>Die KI analysiert den Text und teilt ihn nach inhaltlichen Zusammenh\u00e4ngen auf. Ein Absatz \u00fcber Urlaubsantr\u00e4ge bleibt zusammen, auch wenn er 600 W\u00f6rter lang ist.<\/p>\n\n\n\n<p><strong>Vorteile:<\/strong><\/p>\n\n\n\n<ul class=\"wp-block-list\">\n<li>Beh\u00e4lt inhaltlichen Zusammenhang<\/li>\n\n\n\n<li>Nat\u00fcrliche Grenzen<\/li>\n\n\n\n<li>Bessere Suchergebnisse<\/li>\n<\/ul>\n\n\n\n<p><strong>Nachteile:<\/strong><\/p>\n\n\n\n<ul class=\"wp-block-list\">\n<li>Komplexer zu implementieren<\/li>\n\n\n\n<li>Ungleichm\u00e4\u00dfige Chunk-Gr\u00f6\u00dfen<\/li>\n\n\n\n<li>Mehr Rechenaufwand<\/li>\n<\/ul>\n\n\n\n<p><strong>Fazit:<\/strong> Der Goldstandard, wenn ihr&#8217;s ernst meint.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\">3. Recursive Chunking \u2013 Die russische Matrjoschka<\/h3>\n\n\n\n<p>\u201eTeile nach Kapiteln, dann nach Abschnitten, dann nach Abs\u00e4tzen \u2013 bis es passt.&#8220;<\/p>\n\n\n\n<p><strong>Vorteile:<\/strong><\/p>\n\n\n\n<ul class=\"wp-block-list\">\n<li>Respektiert Dokumentstruktur<\/li>\n\n\n\n<li>Hierarchische Organisation<\/li>\n\n\n\n<li>Flexibel anpassbar<\/li>\n<\/ul>\n\n\n\n<p><strong>Nachteile:<\/strong><\/p>\n\n\n\n<ul class=\"wp-block-list\">\n<li>Braucht strukturierte Dokumente<\/li>\n\n\n\n<li>Komplexe Implementierung<\/li>\n\n\n\n<li>Kann immer noch Kontext verlieren<\/li>\n<\/ul>\n\n\n\n<p><strong>Fazit:<\/strong> Perfekt f\u00fcr gut strukturierte technische Dokumentation.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">Der Overlap-Trick \u2013 Weil Grenzen manchmal flie\u00dfend sein sollten<\/h2>\n\n\n\n<p>Hier kommt ein Geheimtipp: Lasst eure Chunks sich \u00fcberlappen!<\/p>\n\n\n\n<p>Statt harter Grenzen bei Wort 300 und 600, lasst die letzten 50 W\u00f6rter von Chunk 1 auch am Anfang von Chunk 2 erscheinen. Das klingt nach Verschwendung, rettet aber regelm\u00e4\u00dfig den Kontext.<\/p>\n\n\n\n<p><strong>Beispiel:<\/strong><\/p>\n\n\n\n<ul class=\"wp-block-list\">\n<li>Chunk 1 endet mit: \u201e&#8230;deshalb muss der Antrag mindestens 14 Tage vorher eingereicht werden. Bei Krankheit gelten Sonderregeln.&#8220;<\/li>\n\n\n\n<li>Chunk 2 startet mit: \u201eBei Krankheit gelten Sonderregeln. Der Mitarbeiter muss innerhalb von 24 Stunden&#8230;&#8220;<\/li>\n<\/ul>\n\n\n\n<p>Ohne Overlap w\u00fcrde \u201eSonderregeln&#8220; in Chunk 2 aus dem Nichts kommen. Mit Overlap macht&#8217;s Sinn.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">Metadaten \u2013 Die geheime Zutat<\/h2>\n\n\n\n<p>Chunks allein sind gut. Chunks mit Metadaten sind gro\u00dfartig.<\/p>\n\n\n\n<p>F\u00fcgt jedem Chunk hinzu:<\/p>\n\n\n\n<ul class=\"wp-block-list\">\n<li>Dokumentname und Version<\/li>\n\n\n\n<li>Seitenzahl<\/li>\n\n\n\n<li>Kapitel\/Abschnitt<\/li>\n\n\n\n<li>Datum der letzten \u00c4nderung<\/li>\n\n\n\n<li>Abteilung oder Zielgruppe<\/li>\n\n\n\n<li>Tags und Kategorien<\/li>\n<\/ul>\n\n\n\n<p>Dann k\u00f6nnt ihr nicht nur nach Inhalt suchen, sondern auch filtern: \u201eZeig mir nur Chunks aus der HR-Dokumentation, Version 2024, die mit Urlaub zu tun haben.&#8220;<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">Die Horror-Story vom falschen Chunking<\/h2>\n\n\n\n<p>Ein Kollege (nennen wir ihn Max) hat mal ein <a href=\"\/blog\/2025\/10\/31\/chunking-in-rag-warum-die-groesse-doch-zaehlt\/\">RAG-System<\/a> mit 50-Wort-Chunks aufgebaut. Sah super aus, war schnell, funktionierte&#8230;bis zur ersten echten Frage.<\/p>\n\n\n\n<p>\u201eWie beantrage ich Homeoffice?&#8220;<\/p>\n\n\n\n<p>Antwort der KI: \u201eDu musst das Formular ausf\u00fcllen.&#8220;<\/p>\n\n\n\n<p>\u201eWelches Formular?&#8220;<\/p>\n\n\n\n<p>\u201eDas Formular.&#8220;<\/p>\n\n\n\n<p>\u201eWO FINDE ICH DAS VERDAMMTE FORMULAR?!&#8220;<\/p>\n\n\n\n<p>\u201eFormular.&#8220;<\/p>\n\n\n\n<p>Das System hatte den Satz \u201eF\u00fclle das Homeoffice-Formular HO-2024 aus, das du im Intranet unter Formulare &gt; Arbeit &gt; Homeoffice findest&#8220; in drei Chunks zerlegt. Jeder Chunk war f\u00fcr sich genommen nutzlos.<\/p>\n\n\n\n<p>Max hat dann auf 400-Wort-Chunks mit Overlap umgestellt. Das System funktioniert heute noch.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">Praktische Tipps f\u00fcr euer Chunking<\/h2>\n\n\n\n<ol class=\"wp-block-list\">\n<li><strong>Startet mit 300 W\u00f6rtern<\/strong> und justiert nach<\/li>\n\n\n\n<li><strong>Testet mit echten Fragen<\/strong> eurer Nutzer<\/li>\n\n\n\n<li><strong>Respektiert Abs\u00e4tze und Kapitel<\/strong> wo m\u00f6glich<\/li>\n\n\n\n<li><strong>F\u00fcgt Overlap hinzu<\/strong> (50-100 W\u00f6rter)<\/li>\n\n\n\n<li><strong>Nutzt Metadaten<\/strong> f\u00fcr bessere Filterung<\/li>\n\n\n\n<li><strong>Dokumentiert eure Strategie<\/strong> (ihr werdet sie anpassen m\u00fcssen)<\/li>\n\n\n\n<li><strong>Messt die Qualit\u00e4t<\/strong> der Antworten, nicht nur die Geschwindigkeit<\/li>\n<\/ol>\n\n\n\n<h2 class=\"wp-block-heading\">Das Fazit<\/h2>\n\n\n\n<p>Chunking ist wie das Schneiden einer Pizza. Zu gro\u00dfe St\u00fccke, und keiner kriegt sie in den Mund. Zu kleine St\u00fccke, und keiner wei\u00df mehr, dass es mal eine Pizza war. Die perfekte Gr\u00f6\u00dfe? Kommt drauf an, wer isst und wie hungrig er ist.<\/p>\n\n\n\n<p>Die gute Nachricht: Ihr m\u00fcsst das nicht perfekt beim ersten Mal hinbekommen. Startet mit einer vern\u00fcnftigen Strategie, sammelt Feedback und iteriert. <a href=\"\/blog\/2025\/10\/31\/chunking-in-rag-warum-die-groesse-doch-zaehlt\/\">RAG-Systeme<\/a> sind lebendige Systeme \u2013 sie wachsen und lernen mit euch.<\/p>\n\n\n\n<p>Und falls ihr euch immer noch unsicher seid: Fragt euer RAG-System, sobald es l\u00e4uft. Irgendwo auf Seite 247, Absatz 4 steht bestimmt was dazu. Oder ihr habt den Chunk zu klein gemacht und findet&#8217;s nicht mehr. Dann wisst ihr&#8217;s wenigstens.<\/p>\n\n\n\n<p>Happy Chunking!<\/p>\n\n\n\n<blockquote class=\"wp-block-quote is-layout-flow wp-block-quote-is-layout-flow\">\n<p>Wenn du erfahren willst, was mit den Chunks passiert, dann lies den n\u00e4chsten Beitrag: <a href=\"\/blog\/2025\/11\/07\/vektorisierung-bei-rag-wenn-texte-zu-zahlen-werden-und-warum-das-verdammt-clever-ist\/\">Vektorisierung bei RAG \u2013 Wenn Texte zu Zahlen werden (und warum das verdammt clever ist)<\/a><\/p>\n<\/blockquote>\n","protected":false},"excerpt":{"rendered":"<p>Ihr habt euch also entschieden, ein RAG-System aufzubauen. Gl\u00fcckwunsch! Ihr habt eure 500 Seiten Dokumentation digitalisiert, in PDFs konvertiert und seid bereit, die KI-Revolution zu starten. Dann kommt dieser eine Moment, wo jemand fragt: \u201eWie gro\u00df sollen denn die Chunks sein?&#8220; Hinweis: Dieser Artikel baut auf dem RAG-Artikel auf: Die Revolution der Dokumentationszug\u00e4nglichkeit \u2013 Wenn [&hellip;]<\/p>\n","protected":false},"author":1,"featured_media":849,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[1,76],"tags":[59,79,60,77],"class_list":["post-847","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-uncategorized","category-ki","tag-ai","tag-chunking","tag-ki","tag-rag"],"yoast_head":"<!-- This site is optimized with the Yoast SEO plugin v26.5 - https:\/\/yoast.com\/wordpress\/plugins\/seo\/ -->\n<title>Chunking in RAG \u2013 Warum die Gr\u00f6\u00dfe (doch) z\u00e4hlt - Konstantin Filtschew<\/title>\n<meta name=\"description\" content=\"Chunking in RAG ist ein essenzieller Schritt f\u00fcr die Qualit\u00e4t der Ergebnisse. Erfahre wie du dich rantastest inklusive Beispielen.\" \/>\n<meta name=\"robots\" content=\"index, follow, max-snippet:-1, max-image-preview:large, max-video-preview:-1\" \/>\n<link rel=\"canonical\" href=\"https:\/\/konstantin.filtschew.de\/blog\/2025\/10\/31\/chunking-in-rag-warum-die-groesse-doch-zaehlt\/\" \/>\n<meta property=\"og:locale\" content=\"de_DE\" \/>\n<meta property=\"og:type\" content=\"article\" \/>\n<meta property=\"og:title\" content=\"Chunking in RAG \u2013 Warum die Gr\u00f6\u00dfe (doch) z\u00e4hlt - Konstantin Filtschew\" \/>\n<meta property=\"og:description\" content=\"Chunking in RAG ist ein essenzieller Schritt f\u00fcr die Qualit\u00e4t der Ergebnisse. Erfahre wie du dich rantastest inklusive Beispielen.\" \/>\n<meta property=\"og:url\" content=\"https:\/\/konstantin.filtschew.de\/blog\/2025\/10\/31\/chunking-in-rag-warum-die-groesse-doch-zaehlt\/\" \/>\n<meta property=\"og:site_name\" content=\"Konstantin Filtschew\" \/>\n<meta property=\"article:published_time\" content=\"2025-10-31T15:31:02+00:00\" \/>\n<meta property=\"article:modified_time\" content=\"2025-11-30T15:54:02+00:00\" \/>\n<meta property=\"og:image\" content=\"https:\/\/konstantin.filtschew.de\/blog\/wp-content\/uploads\/2025\/10\/Chunking-in-RAG-\u2013-Warum-die-Groesse-doch-zaehlt.png\" \/>\n\t<meta property=\"og:image:width\" content=\"1024\" \/>\n\t<meta property=\"og:image:height\" content=\"683\" \/>\n\t<meta property=\"og:image:type\" content=\"image\/png\" \/>\n<meta name=\"author\" content=\"Konstantin Filtschew\" \/>\n<meta name=\"twitter:card\" content=\"summary_large_image\" \/>\n<meta name=\"twitter:creator\" content=\"@fa11enangel\" \/>\n<meta name=\"twitter:site\" content=\"@fa11enangel\" \/>\n<meta name=\"twitter:label1\" content=\"Verfasst von\" \/>\n\t<meta name=\"twitter:data1\" content=\"Konstantin Filtschew\" \/>\n\t<meta name=\"twitter:label2\" content=\"Gesch\u00e4tzte Lesezeit\" \/>\n\t<meta name=\"twitter:data2\" content=\"6\u00a0Minuten\" \/>\n<script type=\"application\/ld+json\" class=\"yoast-schema-graph\">{\"@context\":\"https:\/\/schema.org\",\"@graph\":[{\"@type\":\"Article\",\"@id\":\"https:\/\/konstantin.filtschew.de\/blog\/2025\/10\/31\/chunking-in-rag-warum-die-groesse-doch-zaehlt\/#article\",\"isPartOf\":{\"@id\":\"https:\/\/konstantin.filtschew.de\/blog\/2025\/10\/31\/chunking-in-rag-warum-die-groesse-doch-zaehlt\/\"},\"author\":{\"name\":\"Konstantin Filtschew\",\"@id\":\"https:\/\/konstantin.filtschew.de\/blog\/#\/schema\/person\/de09aadf27dd3b71cb0030f6f2214b1e\"},\"headline\":\"Chunking in RAG \u2013 Warum die Gr\u00f6\u00dfe (doch) z\u00e4hlt\",\"datePublished\":\"2025-10-31T15:31:02+00:00\",\"dateModified\":\"2025-11-30T15:54:02+00:00\",\"mainEntityOfPage\":{\"@id\":\"https:\/\/konstantin.filtschew.de\/blog\/2025\/10\/31\/chunking-in-rag-warum-die-groesse-doch-zaehlt\/\"},\"wordCount\":1096,\"commentCount\":0,\"publisher\":{\"@id\":\"https:\/\/konstantin.filtschew.de\/blog\/#\/schema\/person\/de09aadf27dd3b71cb0030f6f2214b1e\"},\"image\":{\"@id\":\"https:\/\/konstantin.filtschew.de\/blog\/2025\/10\/31\/chunking-in-rag-warum-die-groesse-doch-zaehlt\/#primaryimage\"},\"thumbnailUrl\":\"https:\/\/konstantin.filtschew.de\/blog\/wp-content\/uploads\/2025\/10\/Chunking-in-RAG-\u2013-Warum-die-Groesse-doch-zaehlt.png\",\"keywords\":[\"ai\",\"chunking\",\"ki\",\"RAG\"],\"articleSection\":[\"Allgemeines\",\"KI\"],\"inLanguage\":\"de\",\"potentialAction\":[{\"@type\":\"CommentAction\",\"name\":\"Comment\",\"target\":[\"https:\/\/konstantin.filtschew.de\/blog\/2025\/10\/31\/chunking-in-rag-warum-die-groesse-doch-zaehlt\/#respond\"]}]},{\"@type\":\"WebPage\",\"@id\":\"https:\/\/konstantin.filtschew.de\/blog\/2025\/10\/31\/chunking-in-rag-warum-die-groesse-doch-zaehlt\/\",\"url\":\"https:\/\/konstantin.filtschew.de\/blog\/2025\/10\/31\/chunking-in-rag-warum-die-groesse-doch-zaehlt\/\",\"name\":\"Chunking in RAG \u2013 Warum die Gr\u00f6\u00dfe (doch) z\u00e4hlt - Konstantin Filtschew\",\"isPartOf\":{\"@id\":\"https:\/\/konstantin.filtschew.de\/blog\/#website\"},\"primaryImageOfPage\":{\"@id\":\"https:\/\/konstantin.filtschew.de\/blog\/2025\/10\/31\/chunking-in-rag-warum-die-groesse-doch-zaehlt\/#primaryimage\"},\"image\":{\"@id\":\"https:\/\/konstantin.filtschew.de\/blog\/2025\/10\/31\/chunking-in-rag-warum-die-groesse-doch-zaehlt\/#primaryimage\"},\"thumbnailUrl\":\"https:\/\/konstantin.filtschew.de\/blog\/wp-content\/uploads\/2025\/10\/Chunking-in-RAG-\u2013-Warum-die-Groesse-doch-zaehlt.png\",\"datePublished\":\"2025-10-31T15:31:02+00:00\",\"dateModified\":\"2025-11-30T15:54:02+00:00\",\"description\":\"Chunking in RAG ist ein essenzieller Schritt f\u00fcr die Qualit\u00e4t der Ergebnisse. Erfahre wie du dich rantastest inklusive Beispielen.\",\"breadcrumb\":{\"@id\":\"https:\/\/konstantin.filtschew.de\/blog\/2025\/10\/31\/chunking-in-rag-warum-die-groesse-doch-zaehlt\/#breadcrumb\"},\"inLanguage\":\"de\",\"potentialAction\":[{\"@type\":\"ReadAction\",\"target\":[\"https:\/\/konstantin.filtschew.de\/blog\/2025\/10\/31\/chunking-in-rag-warum-die-groesse-doch-zaehlt\/\"]}]},{\"@type\":\"ImageObject\",\"inLanguage\":\"de\",\"@id\":\"https:\/\/konstantin.filtschew.de\/blog\/2025\/10\/31\/chunking-in-rag-warum-die-groesse-doch-zaehlt\/#primaryimage\",\"url\":\"https:\/\/konstantin.filtschew.de\/blog\/wp-content\/uploads\/2025\/10\/Chunking-in-RAG-\u2013-Warum-die-Groesse-doch-zaehlt.png\",\"contentUrl\":\"https:\/\/konstantin.filtschew.de\/blog\/wp-content\/uploads\/2025\/10\/Chunking-in-RAG-\u2013-Warum-die-Groesse-doch-zaehlt.png\",\"width\":1536,\"height\":1024,\"caption\":\"Chunking in RAG \u2013 Warum die Gro\u0308\u00dfe doch za\u0308hlt\"},{\"@type\":\"BreadcrumbList\",\"@id\":\"https:\/\/konstantin.filtschew.de\/blog\/2025\/10\/31\/chunking-in-rag-warum-die-groesse-doch-zaehlt\/#breadcrumb\",\"itemListElement\":[{\"@type\":\"ListItem\",\"position\":1,\"name\":\"Startseite\",\"item\":\"https:\/\/konstantin.filtschew.de\/blog\/\"},{\"@type\":\"ListItem\",\"position\":2,\"name\":\"Chunking in RAG \u2013 Warum die Gr\u00f6\u00dfe (doch) z\u00e4hlt\"}]},{\"@type\":\"WebSite\",\"@id\":\"https:\/\/konstantin.filtschew.de\/blog\/#website\",\"url\":\"https:\/\/konstantin.filtschew.de\/blog\/\",\"name\":\"Konstantin Filtschew\",\"description\":\"Der t\u00e4gliche IT-Wahnsinn\",\"publisher\":{\"@id\":\"https:\/\/konstantin.filtschew.de\/blog\/#\/schema\/person\/de09aadf27dd3b71cb0030f6f2214b1e\"},\"potentialAction\":[{\"@type\":\"SearchAction\",\"target\":{\"@type\":\"EntryPoint\",\"urlTemplate\":\"https:\/\/konstantin.filtschew.de\/blog\/?s={search_term_string}\"},\"query-input\":{\"@type\":\"PropertyValueSpecification\",\"valueRequired\":true,\"valueName\":\"search_term_string\"}}],\"inLanguage\":\"de\"},{\"@type\":[\"Person\",\"Organization\"],\"@id\":\"https:\/\/konstantin.filtschew.de\/blog\/#\/schema\/person\/de09aadf27dd3b71cb0030f6f2214b1e\",\"name\":\"Konstantin Filtschew\",\"image\":{\"@type\":\"ImageObject\",\"inLanguage\":\"de\",\"@id\":\"https:\/\/konstantin.filtschew.de\/blog\/#\/schema\/person\/image\/\",\"url\":\"https:\/\/konstantin.filtschew.de\/blog\/wp-content\/uploads\/2025\/10\/KFLogo1.png\",\"contentUrl\":\"https:\/\/konstantin.filtschew.de\/blog\/wp-content\/uploads\/2025\/10\/KFLogo1.png\",\"width\":222,\"height\":193,\"caption\":\"Konstantin Filtschew\"},\"logo\":{\"@id\":\"https:\/\/konstantin.filtschew.de\/blog\/#\/schema\/person\/image\/\"},\"description\":\"Building an operation system without source code, is like buying a self assemble space shuttle without instructions. (Author unknown)\",\"sameAs\":[\"https:\/\/konstantin.filtschew.de\",\"https:\/\/www.linkedin.com\/in\/konstantin-filtschew-b7138019\/\",\"https:\/\/x.com\/fa11enangel\"],\"url\":\"https:\/\/konstantin.filtschew.de\/blog\/author\/konstantin-filtschew\/\"}]}<\/script>\n<!-- \/ Yoast SEO plugin. -->","yoast_head_json":{"title":"Chunking in RAG \u2013 Warum die Gr\u00f6\u00dfe (doch) z\u00e4hlt - Konstantin Filtschew","description":"Chunking in RAG ist ein essenzieller Schritt f\u00fcr die Qualit\u00e4t der Ergebnisse. Erfahre wie du dich rantastest inklusive Beispielen.","robots":{"index":"index","follow":"follow","max-snippet":"max-snippet:-1","max-image-preview":"max-image-preview:large","max-video-preview":"max-video-preview:-1"},"canonical":"https:\/\/konstantin.filtschew.de\/blog\/2025\/10\/31\/chunking-in-rag-warum-die-groesse-doch-zaehlt\/","og_locale":"de_DE","og_type":"article","og_title":"Chunking in RAG \u2013 Warum die Gr\u00f6\u00dfe (doch) z\u00e4hlt - Konstantin Filtschew","og_description":"Chunking in RAG ist ein essenzieller Schritt f\u00fcr die Qualit\u00e4t der Ergebnisse. Erfahre wie du dich rantastest inklusive Beispielen.","og_url":"https:\/\/konstantin.filtschew.de\/blog\/2025\/10\/31\/chunking-in-rag-warum-die-groesse-doch-zaehlt\/","og_site_name":"Konstantin Filtschew","article_published_time":"2025-10-31T15:31:02+00:00","article_modified_time":"2025-11-30T15:54:02+00:00","og_image":[{"url":"https:\/\/konstantin.filtschew.de\/blog\/wp-content\/uploads\/2025\/10\/Chunking-in-RAG-\u2013-Warum-die-Groesse-doch-zaehlt.png","width":1024,"height":683,"type":"image\/png"}],"author":"Konstantin Filtschew","twitter_card":"summary_large_image","twitter_creator":"@fa11enangel","twitter_site":"@fa11enangel","twitter_misc":{"Verfasst von":"Konstantin Filtschew","Gesch\u00e4tzte Lesezeit":"6\u00a0Minuten"},"schema":{"@context":"https:\/\/schema.org","@graph":[{"@type":"Article","@id":"https:\/\/konstantin.filtschew.de\/blog\/2025\/10\/31\/chunking-in-rag-warum-die-groesse-doch-zaehlt\/#article","isPartOf":{"@id":"https:\/\/konstantin.filtschew.de\/blog\/2025\/10\/31\/chunking-in-rag-warum-die-groesse-doch-zaehlt\/"},"author":{"name":"Konstantin Filtschew","@id":"https:\/\/konstantin.filtschew.de\/blog\/#\/schema\/person\/de09aadf27dd3b71cb0030f6f2214b1e"},"headline":"Chunking in RAG \u2013 Warum die Gr\u00f6\u00dfe (doch) z\u00e4hlt","datePublished":"2025-10-31T15:31:02+00:00","dateModified":"2025-11-30T15:54:02+00:00","mainEntityOfPage":{"@id":"https:\/\/konstantin.filtschew.de\/blog\/2025\/10\/31\/chunking-in-rag-warum-die-groesse-doch-zaehlt\/"},"wordCount":1096,"commentCount":0,"publisher":{"@id":"https:\/\/konstantin.filtschew.de\/blog\/#\/schema\/person\/de09aadf27dd3b71cb0030f6f2214b1e"},"image":{"@id":"https:\/\/konstantin.filtschew.de\/blog\/2025\/10\/31\/chunking-in-rag-warum-die-groesse-doch-zaehlt\/#primaryimage"},"thumbnailUrl":"https:\/\/konstantin.filtschew.de\/blog\/wp-content\/uploads\/2025\/10\/Chunking-in-RAG-\u2013-Warum-die-Groesse-doch-zaehlt.png","keywords":["ai","chunking","ki","RAG"],"articleSection":["Allgemeines","KI"],"inLanguage":"de","potentialAction":[{"@type":"CommentAction","name":"Comment","target":["https:\/\/konstantin.filtschew.de\/blog\/2025\/10\/31\/chunking-in-rag-warum-die-groesse-doch-zaehlt\/#respond"]}]},{"@type":"WebPage","@id":"https:\/\/konstantin.filtschew.de\/blog\/2025\/10\/31\/chunking-in-rag-warum-die-groesse-doch-zaehlt\/","url":"https:\/\/konstantin.filtschew.de\/blog\/2025\/10\/31\/chunking-in-rag-warum-die-groesse-doch-zaehlt\/","name":"Chunking in RAG \u2013 Warum die Gr\u00f6\u00dfe (doch) z\u00e4hlt - Konstantin Filtschew","isPartOf":{"@id":"https:\/\/konstantin.filtschew.de\/blog\/#website"},"primaryImageOfPage":{"@id":"https:\/\/konstantin.filtschew.de\/blog\/2025\/10\/31\/chunking-in-rag-warum-die-groesse-doch-zaehlt\/#primaryimage"},"image":{"@id":"https:\/\/konstantin.filtschew.de\/blog\/2025\/10\/31\/chunking-in-rag-warum-die-groesse-doch-zaehlt\/#primaryimage"},"thumbnailUrl":"https:\/\/konstantin.filtschew.de\/blog\/wp-content\/uploads\/2025\/10\/Chunking-in-RAG-\u2013-Warum-die-Groesse-doch-zaehlt.png","datePublished":"2025-10-31T15:31:02+00:00","dateModified":"2025-11-30T15:54:02+00:00","description":"Chunking in RAG ist ein essenzieller Schritt f\u00fcr die Qualit\u00e4t der Ergebnisse. Erfahre wie du dich rantastest inklusive Beispielen.","breadcrumb":{"@id":"https:\/\/konstantin.filtschew.de\/blog\/2025\/10\/31\/chunking-in-rag-warum-die-groesse-doch-zaehlt\/#breadcrumb"},"inLanguage":"de","potentialAction":[{"@type":"ReadAction","target":["https:\/\/konstantin.filtschew.de\/blog\/2025\/10\/31\/chunking-in-rag-warum-die-groesse-doch-zaehlt\/"]}]},{"@type":"ImageObject","inLanguage":"de","@id":"https:\/\/konstantin.filtschew.de\/blog\/2025\/10\/31\/chunking-in-rag-warum-die-groesse-doch-zaehlt\/#primaryimage","url":"https:\/\/konstantin.filtschew.de\/blog\/wp-content\/uploads\/2025\/10\/Chunking-in-RAG-\u2013-Warum-die-Groesse-doch-zaehlt.png","contentUrl":"https:\/\/konstantin.filtschew.de\/blog\/wp-content\/uploads\/2025\/10\/Chunking-in-RAG-\u2013-Warum-die-Groesse-doch-zaehlt.png","width":1536,"height":1024,"caption":"Chunking in RAG \u2013 Warum die Gro\u0308\u00dfe doch za\u0308hlt"},{"@type":"BreadcrumbList","@id":"https:\/\/konstantin.filtschew.de\/blog\/2025\/10\/31\/chunking-in-rag-warum-die-groesse-doch-zaehlt\/#breadcrumb","itemListElement":[{"@type":"ListItem","position":1,"name":"Startseite","item":"https:\/\/konstantin.filtschew.de\/blog\/"},{"@type":"ListItem","position":2,"name":"Chunking in RAG \u2013 Warum die Gr\u00f6\u00dfe (doch) z\u00e4hlt"}]},{"@type":"WebSite","@id":"https:\/\/konstantin.filtschew.de\/blog\/#website","url":"https:\/\/konstantin.filtschew.de\/blog\/","name":"Konstantin Filtschew","description":"Der t\u00e4gliche IT-Wahnsinn","publisher":{"@id":"https:\/\/konstantin.filtschew.de\/blog\/#\/schema\/person\/de09aadf27dd3b71cb0030f6f2214b1e"},"potentialAction":[{"@type":"SearchAction","target":{"@type":"EntryPoint","urlTemplate":"https:\/\/konstantin.filtschew.de\/blog\/?s={search_term_string}"},"query-input":{"@type":"PropertyValueSpecification","valueRequired":true,"valueName":"search_term_string"}}],"inLanguage":"de"},{"@type":["Person","Organization"],"@id":"https:\/\/konstantin.filtschew.de\/blog\/#\/schema\/person\/de09aadf27dd3b71cb0030f6f2214b1e","name":"Konstantin Filtschew","image":{"@type":"ImageObject","inLanguage":"de","@id":"https:\/\/konstantin.filtschew.de\/blog\/#\/schema\/person\/image\/","url":"https:\/\/konstantin.filtschew.de\/blog\/wp-content\/uploads\/2025\/10\/KFLogo1.png","contentUrl":"https:\/\/konstantin.filtschew.de\/blog\/wp-content\/uploads\/2025\/10\/KFLogo1.png","width":222,"height":193,"caption":"Konstantin Filtschew"},"logo":{"@id":"https:\/\/konstantin.filtschew.de\/blog\/#\/schema\/person\/image\/"},"description":"Building an operation system without source code, is like buying a self assemble space shuttle without instructions. (Author unknown)","sameAs":["https:\/\/konstantin.filtschew.de","https:\/\/www.linkedin.com\/in\/konstantin-filtschew-b7138019\/","https:\/\/x.com\/fa11enangel"],"url":"https:\/\/konstantin.filtschew.de\/blog\/author\/konstantin-filtschew\/"}]}},"_links":{"self":[{"href":"https:\/\/konstantin.filtschew.de\/blog\/wp-json\/wp\/v2\/posts\/847","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/konstantin.filtschew.de\/blog\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/konstantin.filtschew.de\/blog\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/konstantin.filtschew.de\/blog\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/konstantin.filtschew.de\/blog\/wp-json\/wp\/v2\/comments?post=847"}],"version-history":[{"count":4,"href":"https:\/\/konstantin.filtschew.de\/blog\/wp-json\/wp\/v2\/posts\/847\/revisions"}],"predecessor-version":[{"id":873,"href":"https:\/\/konstantin.filtschew.de\/blog\/wp-json\/wp\/v2\/posts\/847\/revisions\/873"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/konstantin.filtschew.de\/blog\/wp-json\/wp\/v2\/media\/849"}],"wp:attachment":[{"href":"https:\/\/konstantin.filtschew.de\/blog\/wp-json\/wp\/v2\/media?parent=847"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/konstantin.filtschew.de\/blog\/wp-json\/wp\/v2\/categories?post=847"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/konstantin.filtschew.de\/blog\/wp-json\/wp\/v2\/tags?post=847"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}