
Die Projektgruppe Smart Platform for Advanced Resource Knowledge (SPARK) ist Teil des Forschungsprojekts TaDeA und läuft von April 2025 bis April 2026.
Die Finanzverwaltung steht vor der anspruchsvollen Aufgabe, komplexe wirtschaftliche Sachverhalte und Unternehmensstrukturen auf ihre steuerrechtliche Relevanz zu bewerten. Insbesondere bei Konzernen mit grenzüberschreitender Tätigkeit erfordert dies für eine fundierte Analyse der zu prüfenden Sachverhalte in wirtschaftlicher und rechtlicher Hinsicht, dass steuerliches Fach- und Fallwissen effektiv im Workflow verfügbar ist. Die zunehmende Digitalisierung und die Komplexität der Rechtsordnung erhöhen diese Anforderungen, nicht nur allein in der Prüfung grenzüberschreitender Konzerne. Erfahrungswissen, Rechtsinformationen und Fachkenntnisse sind über verschiedene Datenquellen und Datenbanken in unterschiedlichen Formaten verteilt und erfordern u.U. erheblichen Aufwand für die Rechtsrecherche und Informationssuche.
Projektvision und -mission
Die Vision des Projektes ist es, ein innovatives Wissens- und Dokumentationsmanagementsystem zu schaffen, welches durch den gezielten Einsatz von KI-Technologien, insbesondere in der Betriebsprüfung, grundlegend verbessert wird. Im Vordergrund steht hierbei, die Verfügbarkeit, Nachvollziehbarkeit und Strukturierung relevanter Informationen zu optimieren. Die Mission des Projektes ist es, Sachbearbeiter:innen KI-gestützt dazu in die Lage zu versetzen, komplexe steuerliche Sachverhalte effizient und konsistent zu analysieren, indem der Zugriff auf relevante Informationen optimiert wird.
Projektrahmen
Bei der Projektgruppe SPARK handelt es sich um eine der Projektgruppen der Carl von Ossietzky Universität Oldenburg. Diese Projektgruppen stellen eine Lehrveranstaltungsform dar, bei der Studierende der Informatik und Wirtschaftsinformatik im Laufe eines Jahres ein Softwareprojekt planen, umsetzen und dokumentieren. Dies geschieht in der Regel in einer Gruppengröße von sechs bis zwölf Personen und soll den Studierenden grundlegende Kompetenzen wie die Bewältigung komplexer Problemstellungen, die Arbeit in einem Team und die Kommunikation mit Stakeholdern sowie untereinander für das zukünftige Berufsleben vermitteln.
Zentrales Wissens- und Dokumentenmanagement
Kern des Projektes ist die Entwicklung eines Prototyps eines umfassenden, strukturierten und KI-gestützten Dokumenten- und Wissensmanagementsystems als Proof of Concept. Mit SPARK sollen die Möglichkeiten der Nutzung generativer KI zur intelligenten Bereitstellung und Vernetzung von Wissen und Informationen aufgezeigt werden. Im Fokus stehen dabei insbesondere die zentrale Organisation sowie die geordnete Verfügbarkeit relevanter Informationen.
Ein wesentliches Problem in der aktuellen Arbeitspraxis besteht in der Dezentralität sowie der unstrukturierten Verfügbarkeit von Expertenwissen und relevanten Unterlagen. Häufig liegt Wissen in Form von „Inselwissen“ aufgrund besonderer Zuständigkeiten und Fallkonstellationen vor und ist in der Bearbeitung vergleichbarer Fälle nicht zugänglich oder erfordert einen besonderen Aufwand in der Informationssuche.
Ziel des Projekts ist daher die systematische Strukturierung der steuerlich relevanten Informationen in einer einzelnen Wissensdatenbank. Gesetze und andere rechtliche Grundlagen bilden die Basis, Fallbeispiele und Inselwissen ergänzen diese. Gesetze, Verordnungen, Urteile, Erlasse, Verfügungen bezogen auf die jeweilige Aufgabe bilden die Basis, dokumentiertes Fallwissen, Praxiskenntnisse oder anderes Inselwisse ergänzen diese. Über diese Zentralisierung des Wissens für die jeweilige Aufgabe soll die Effizienz, Konsistenz und Qualität in der steuerlichen Wissensarbeit am Beispiel der Auslandsfachprüfung signifikant verbessert werden und dient als Grundlage für eine Weiterentwicklung und Anpassung auf verschiedene Arbeitsbereiche.
Die SPARK Wissensdatenbank adressiert das oben geschilderte Problem. Durch die Realisierung der oben genannten Zentralisierung und Strukturierung dieser Daten in Zusammenarbeit mit Anwendern sollen so Rechtsdokumente, Internetquellen und Expertenwissen über ein System bereitgestellt werden. Neben der Möglichkeit einer händischen Informationsdurchsicht wird dieses Wissen Nutzerinnen und Nutzern durch die Verwendung von Large Language Models (LLMs) auch KI-gestützt zugänglich gemacht.
Technische Grundlagen
SPARK ist auf Softwareebene in Frontend und Backend getrennt. Letzteres stellt unter anderem lokal gehostete Open Source LLMs und relevante Dokumente für die Sachbearbeiter:innen bereit. Das Frontend stellt Funktionen und Informationen aus dem Backend für Anwender in einer nutzerfreundlichen Oberfläche dar.
Das untenstehende Bild zeigt die aktuelle Oberfläche des Frontend. Hier können Nutzer mit gespeicherten Inhalten interagieren oder neue hinzufügen. Der Chat ermöglicht die KI-gestützte Datenauswertung in natürlicher Sprache und orientiert sich an gängigen Oberflächen.

Retrieval Augmented Generation (RAG)
Bei den im Backend verwendeten LLMs handelt es sich um vortrainierte Modelle mit breit gefächertem Wissen. Damit mangelt es an spezifischem Fachwissen für den konkreten Anwendungsfall. Mit dem Einsatz von Retrieval Augmented Generation (RAG) können zur Laufzeit weitere Informationsquellen in den Prozess der Antwortgenerierung eingebracht werden. Durch diese Erweiterung kann spezialisiertes Fachwissen durch die entwickelte Wissensdatenbank ergänzt und auf die Anforderungen der Nutzer angepasst werden.
Die untere Abbildung zeigt den um RAG erweiterten Antwortprozess. Nach der Zerlegung einer eingehenden Anfrage erfolgt die Bearbeitung der Teilanfragen. Hierzu werden durch weitere nachgelagerte Prozesse passenden Informationen aus angebundenen Quellen bereitgestellt.
