Förutsättningar
I tidigare problem undersökte du Benfords lag som säger att förstasiffran i många verkliga datamängder följer sannolikhetsfördelningen nedan
p(n) = lg(1 + 1 / n)
Lagen är döpt efter Frank Benford som formulerade och undersökte lagen 1938.
Denna lag har använts för att upptäcka bokföringsbrott. Om en skrupelfri person med begränsade matematikkunskaper exempelvis ändrar i de rapporterade dagskassorna kan det vara möjligt att upptäcka det genom att förstasiffrorna inte följer Benfords lag.
Problem 4
Bensinmackarna BP, Esso, Gulf, Texaco och UnoX har lämnat in 365 dagskassor till en redovisningsbyrå. Ni har fått i uppdrag av byrån att undersöka om det är någon av dessa dagskassor som verkar vara manipulerad.
Programmering
Ni vill skriva ett program som avslöjar eventuellt bokföringsbrott Gör samma typ av beräkning som för halveringstiderna och jämför de relativa frekvenserna med Benfords lag.
Längst ned under "Programskal" finns ett skal till ett program ni kan använda. I listorna BP, Esso, Gulf, Texaco och UnoX finns 365 dagskassor (i kr).
Försök gärna skriva ett program som automatiskt kan avgöra om fördelningen avviker "för mycket" från den ideala. Om ni vill skapa ett tillägg till programmet som undersöker avvikelserna så skulle ni kunna beräkna felkvadratsumman för varje fördelning: ta avvikelsen av den relativa frekvensen från den förväntade sannolikheten för en förstasiffra, kvadrera och summera alla dessa kvadrater för de olika förstasiffrorna. Det tal ni får är ett mått på hur mycket fördelningen avviker från den förväntade, alltså den som ges av Benfords lag.
Använd ert program och avgör vilka två av de fem bensinmackarna vars dagskassor ni fått tillgång till har misstänkta dagskassor. Ange de misstänkta mackarna på svarspappret. Hur avviker de från den förväntade fördelningen?