Metody i narzędzia weryfikacji rzetelności danych liczbowych

Abstrakt
W pracy przedstawiono problematykę rozkładu cyfr znaczących w dużych zbiorach danych liczbowych pochodzących z pomiaru. Empiryczne rozkłady cyfr znaczących opisane są funkcjami matematycznymi ze ściśle sprecyzowanymi parametrami. Odstępstwo rozkładów empirycznych od rozkładów teoretycznych może oznaczać, że analizowany zbiór danych liczbowych zawiera niewiarygodne informacje. Szczegółowa analiza rozbieżności pozwala ponadto wskazać, które dane są najmniej wiarygodne. Narzędzia analizy rozkładów cyfr znaczących są użyteczne w każdych badaniach empirycznych, gdyż rzetelność danych źródłowych ma fundamentalne znaczenie dla poprawności wniosków wynikających z przeprowadzanych analiz. Prezentowana praca zawiera charakterystykę metod i procedur weryfikacji danych podaną w przystępny sposób i zilustrowaną praktycznymi przykładami. W rozdziale pierwszym przedstawiono genezę i historię odkryć naukowych związanych z szeroko rozumianymi prawami liczbowymi, m.in. regułę Pareto, ciągi Fibonacciego i Lukasa, prawa Estoupa, Zipfa, Heapsa oraz prawa Newcomba-Benforda. Szczegółowe omówienie rozkładów cyfr znaczących, testów i mierników służących do oceny stopnia zbieżności rozkładów empirycznych z rozkładami teoretycznymi przytoczone jest w rozdziale drugim. Zamieszczono tu również uzasadnienie teoretyczne praw rządzących rozkładami pierwszych, drugich i kolejnych cyfr znaczących a także rozkładów uogólnionych i alternatywnych. Rozdział trzeci ma charakter narzędziowy i zawiera opis dostępnych w Internecie, darmowych aplikacji komputerowych wykorzystywanych w procedurach analitycznych związanych z prawami Benforda rozkładu cyfr znaczących. Są to m.in. programy: EZ-R Stats for Excel, Web Computer Assisted Audit Tool (Web CAAT), Digital Analysis Tests and Statistics (DATAS), Benford’s Law Utility, W kolejnym, czwartym rozdziale przedstawiono autorskie narzędzie analizy danych wykorzystujące makroinstrukcje arkusza kalkulacyjnego do realizacji ciągu obliczeń zgodnie z omówionymi wcześniej procedurami. Aplikacja ta udostępniona jest na stronie www.benford.pl i pozwala przeprowadzać złożone obliczenia w sposób maksymalnie zautomatyzowany. Ostatni, piąty rozdział zawiera przykład pełnej analizy zbioru danych dotyczących blisko 6 tys. faktur zakupowych apteki X. Analizę przeprowadzono przy pomocy narzędzia omówionego w rozdziale czwartym wykorzystując rozkład pierwszej (F1), drugiej (D2), trzeciej (D3), dwóch pierwszych (F2), trzech pierwszych (F3) oraz ostatniej (L1) cyfry znaczącej. Reasumując, praca stanowi użyteczne narzędzie praktyczne w zakresie infometrii, zajmującej się oceną i poprawą jakości informacji. Narzędzia wypracowane w ramach tej dyscypliny stosowane są w różnych obszarach dziedzinowych takich jak: naukometria, bibliometria, infobrokering, webometria itd. Metody omówione w pracy mogą też być wykorzystane w e-learningu, zwłaszcza w procedurach weryfikujących poprawność sprawdzianów wiedzy czy też do oceny wiarygodności opinii studentów pozyskiwanych w trakcie ewaluacji kursów e-learningowych. W dalszych badaniach przewiduje się wdrożenie procedur omówionych w niniejszej monografii do szeroko rozumianej polityki podnoszenia jakości kształcenia w formie e-learningowej.
Opis
Praca recenzowana / Peer-reviewed paper
Słowa kluczowe
Źródło
Licencja powiązana z tą pozycją
Uznanie autorstwa-Użycie niekomercyjne-Bez utworów zależnych 3.0 Polska
Uznanie autorstwa-Użycie niekomercyjne-Bez utworów zależnych 3.0 Polska