
Googles jättesamling av texter öppnar för nya forskningsmetoder.
Jätteprojektet Google Books, där sökmotorföretaget vill lägga ut digitala versioner av alla världens böcker på internet, har väckt både kritik och applåder. Ett av resultaten är att enorma textmängder blir sökbara och ger helt nya möjligheter för statistiska analyser för språkforskare och litteraturvetare.
Nu behöver man inte begränsas till hur många texter en enskild person hinner läsa, när en dator kan göra det istället. Ett analysprojekt vid Harvard har testat materialet och fått fram en rad intressanta nya fakta.
Till exempel kan man se tydliga förändringar i mängden ord i det engelska språket. De senaste 100 åren har antalet nästan fördubblats, till över en miljon.
Och mer än hälften av orden finns inte i standardlexikon – något som forskarna döpt till ”språkets mörka materia”.
Man kan också se hur känsliga begrepp som Himmelska fridens torg försvinner ur kinesiska texter efter massakern 1989, eller hur namnen på politiskt kontroversiella skådespelare minskade i frekvens under 50-talet i USA.
Det statistiska materialet som användes består av över 500 miljarder ord.












