Im Rahmen der digitalen Betriebsprüfungen werden vermehrt die Begriffe „Chi-Quadrat-Test“ und „Benford’s Law“ genannt. Der nachfolgende Artikel soll einen kurzen Überblick über den Hintergrund und die Anwendungsmöglichkeiten des Prüfungsansatzes „Chi-Quadrat-Test“ geben.
Der Chi-Quadrat-Test ist nach dem 22. Buchstaben im griechischen Alphabet benannt und wurde im Jahre 1900 von dem amerikanischen Statistiker Karl Pearson entwickelt (daher auch die Bezeichnung „Pearson’s Chi-Quadrat). Mit dem Chi-Quadrat-Test wird die Verteilungseigenschaft einer Datenmenge untersucht. Dabei kann es sich um verschiedenste Daten handeln. Im Bereich der Betriebsprüfung werden zum Beispiel Kassenumsätze oder km-Angaben in Fahrtenbüchern mittels des Chi-Quadrat-Tests untersucht. Geprüft wird, ob die vorliegenden Daten der erwarteten Zahlenverteilung entstammen. Im Ergebnis wird ein sog. Chi-Wert als Maß für die Übereinstimmung mit der erwarteten Zahlenverteilung ermittelt. Je größer der Chi-Wert ist, je geringer ist die Wahrscheinlichkeit, dass die vorliegende Zahlenverteilung der erwarteten Verteilung entspricht.
Im Rahmen von (digitalen) steuerlichen Außenprüfungen wird der Chi-Quadrat-Test z.B. zur Prüfung der (Kassen-) Einnahmen verwendet. Typischerweise werden die Ziffernverteilungen der letzten Vorkommastellen („10 EUR Stelle“, „1 EUR Stelle“) und der Nachkommastellen auf ihre Übereinstimmung mit einer erwarteten Ziffernverteilung überprüft. Im Regelfall wird hierbei von einer Gleichverteilung der Ziffern ausgegangen, d.h. es wird erwartet, dass jede Ziffer mit einer gleichen Wahrscheinlichkeit (d.h. 1/10 = 10%) auftritt. Grundsätzlich könnte jedoch auch jede andere Zahlenverteilung (z.B. eine Benford-Verteilung) als Grundlage dienen. Bei einer hinreichend großen Anzahl von Datensätzen soll sich nun die Ist-Verteilung an die erwartete Verteilung annähern. Die Vermutung der Finanzverwaltung lautet nun, dass eine manipulierte Buchführung nicht der erwarteten Verteilung (meist: Gleichverteilung) entspricht. Es wird davon ausgegangen, dass jeder Mensch – bewusst oder unbewusst – eine oder mehrere Lieblingsziffern habe, die er in Zusammenhang mit frei erfundenen Zahlen (z.B. verfälschten Tageseinnahmen) entsprechend häufiger verwende. Gleichzeitig würde er nach denselben Grundsätzen auch eine Abneigung gegen eine oder mehrere Ziffern haben. Diese würden entsprechend – wiederum bewusst oder unbewusst – seltener verwendet. Diese, von der erwarteten Verteilung abweichende, Ist-Verteilung kann durch den Chi-Wert gemessen werden. Je größer der Chi-Wert ausfällt, desto stärker weicht die vorliegende Verteilung von der erwarteten Verteilung ab, was in den Augen der Finanzverwaltung ein Merkmal für eine manipulierte Datenbasis (Buchführung) darstellen kann. Sofern die Ziffernfolge „0“ bis „9“ untersucht wird, bedeutet ein Chi-Wert von über 19,02, dass die vorliegende Verteilung mit einer Wahrscheinlichkeit von 97,5% nicht der erwarteten Verteilung entspricht. Dies ist jedoch nicht notwendigerweise ein Zeichen für eine Manipulation der Daten. Vielmehr ist zu prüfen, ob die angenommene Verteilung überhaupt der tatsächlichen Verteilung entspricht. Beispielsweise kann die Verwendung von Schwellenpreisen (z.B. 1,99 EUR) zu einer deutlichen Abweichung von der Normalverteilung führen. Ferner ist zu prüfen, ob die verwendete Datenmenge ausreichend groß gewählt wurde. Die Finanzverwaltung geht bereits bei einer Datenmenge von 50 Datensätzen von einer ausreichend großen Datenbasis aus, während Statistiker erst mehrere Hundert oder gar Tausende von Datensätzen als eine ausreichend große Datenbasis erachten.
Im Ergebnis kann festgehalten werden, dass ein überhöhter Chi-Wert alleine noch kein Merkmal für eine Manipulation darstellt. Neben dem Vorliegen weiterer Anzeichen, wie z.B. negativer Kassenbestände, fehlender Belege o.ä. ist vor allem zu prüfen, ob die angenommene Zahlen-verteilung überhaupt zutreffend ist.
An der Pauluskirche 3-5,
50677 Köln,
Telefon: +49 221 39 09 770
Tödistrasse 53, CH-8027 Zürich,
Telefon: +41 44 212 3535