Acasa > Crearea datelor > Ghid de buna practica

Ghid de buna practica

O buna documentare a datelor are o importanta cruciala atat pentru pastrarea datelor pentru viitor, cat si pentru analiza secundara curenta. Orice persoana care foloseste un set de date are nevoie de toate informatiile disponibile pentru a produce tabele relevante si pentru a trage concluzii consistente.

Pentru un buna documentare a setului de date, producatori datelor pot pregati:

  • Setul de date: curatat, variabilele si valorile lor etichetate
  • Chestionarul in original (atat o forma printata cat si una electronica)
  • Informatii despre cercetarea in urma careia a fost produs setul de date

Setul de date

Foarte important pentru utilizatorii unui set de date este claritatea acestuia, concordanta variabilelor din baza cu intrebarile din chestionar, precum si masura in care variabilele se pot ‘explica’ prin ele insele. Sunt nenumarate exemple in care variabile potential valoroase nu mai pot fi folosite din lipsa de informatii asupra valorilor (ex. in variabilele deschise). Dupa o perioada, aceste informatii se pierd pentru totdeauna. Trebuie pregatite informatii legate de structura setului de date, cu o lista completa a variabilelor si descrierea acestora, inclusiv detalii legate de procesul de codificare si a clasificarilor folosite.

La fel de folositoare sunt informatiile legate de variabilele derivate din cele culese. Trebuie explicat in detaliu algoritmul de derivare, eventual cu formula utilizata (acolo unde este cazul).

Chestionarul

Desi unele variabile sunt auto-explicative, sunt multe cazuri in are o mai buna intelegere poate fi adusa de citirea intrebarii corespondente din chestionar.

Pentru cercetarile relativ recente, pentru care exista o forma electronica a chestionarului, ar fi de mare ajutor pregatirea acestuia intr-o varianta recenta de Microsoft Word, cu paginarea originala. Preferabil ar fi ca versiunea electronica sa contina si caracterele diacritice.

Pentru cercetarile mai putin recente, putem scana o copie fizica a chestionarului si sa incercam transformarea acestuia in text prin utilizarea unui program de recunoastere optica a caracterelor.

Informatii despre cercetarea in sine

Aceste informatii sunt esentiale pentru utilizatori; o intelegere completa a setului de date si a continutului acestuia nu poate fi atinsa fara pregatirea acestor informatii.

Pentru fiecare set de date, RODA completeaza un formular de descriere a studiului. Acest formular este utilizat de toate arhivele de date cu prestigiu din lume si se bazeaza pe structura DDI (Data Documentation Initiative), un proiect promovat de ICPSR, Michigan SUA.

Este necesara pregatirea detaliata a informatiilor legate de metodele de culegere a datelor, a instructiunilor pentru operatorii de teren, proceduri de esantionare, proceduri de ponderare.

Persoanele interesate pot consulta Formularul de depunere pentru completarea informatiilor relevante.