Språket gjør det mulig å overføre informasjon mellom to parter, og brukes for å angi begreper eller forbindelsen mellom begrepene. Begreper som forsøker å beskrive "verden" eller "noe" i verden. Imidlertid er det dagligdagse språket altfor mangfoldig og ordene vi bruker altfor difuse og tvetydige til at lar seg bruke i en dataanalyse. Som vi allerede har vært inne på må dataene vi har samlet inn kodes og systematiseres for at det skal være mulig å registrere dem i en databases, hvor vi kan analysere dem ved hjelp av statistiske metoder. Språket vi benytter oss av når vi skal kode og registrere de innsamlede dataene kalles indeksspråket, eller bare i-språket. I - språket har som oppgave er å beskrive, klassifisere og gruppere data/informasjon, og kjennetegnes av et begrenset vokabular, hvor enkeltordene er underlagt strenge formregler. Skal vi registrere opplysninger om fylke, kan man velge mellom 19 ulike ord (Oslo, Akershus, Østfold osv.) som dekker Norges fylker.
Ofte er det et "slektskap" eller et generisk forhold mellom begrepene i språket. Om det foreligger et generisk forhold mellom to begreper, kan avgjøres med "noen alle" testen:
- Noen mennesker er gutter - alle gutter er mennesker
- Noen biler er personbiler - alle personbiler er biler
I andre tilfeller står vi ovenfor partitive forhold . Dvs. at begrepet er en del av noe annet. F.eks.:
- Norge er en del av Europa og Norland er en del av Norge
- Stemplet er en del av motoren, og motoren er en del av bilen
Årsaken til at vi nevner dette, skyldes at det er viktig å være klar over disse sammenhengene når man skal organisere, systematisere, kode, registrere og analysere de innsamlede data.
Begrepene som utgjør i-språket er av forskjellig "typer" som vi kaller kategorier. Begreper som er generisk beslektet må f.eks. tilhøre samme kategori, og partitive begreper må inngå i samme struktur. Eksempler på kategorier er:
- Ting
- Trær, studenter, bilder, hus, båter - Aktiviteter
- Løping, lesing, bowling - Egenskaper
- Slitestyrke, hurtighet, vaskbarhet
Spesielt er bruken av kategorier mye andvend ved kvalitative undersøkelser, hvor de kun er mulig å måle variablenes verdier på en nominal og ordinal nivå. Nominalt nivå vil si at det kun er mulig å registrere verdiene i kategorier. Siden vi ved kvalitative undersøkelser som regel benytter åpne spørsmål, er det ofte svært vanskelig å bygge opp ett i - språk med valide kategorier. Litt enklere er det ved kvantitative undersøkelser, da spørsmålene hovedsakelig er predkodede.