Hoe brûke 'Ngram Viewer' ark yn Google Boeken

In Ngram, ek wol in n-gram neamd, is in statistyske analyze fan tekst of sprekke ynhâld om n (in nûmer) fan in soart item yn 't tekst te finen. It kin allerhanne dingen wêze, lykas phonemes, prefikses, sifers, of letters. Hoewol it N-gram in bytsje ûndúdlik is bûten ûndersiker, wurdt it eins yn in ferskaat oan fjilden brûkt en hat in soad gefolgen foar minsken dy't kompjûterprogramma meitsje dy't begripe en reagearje mei natuerlike sprutsen taal. Dat, yn in nutshell, soe Google belang wêze foar it idee.

Yn it gefal fan Google Books Ngram Viewer komt de tekst te analysearjen fan 'e folle grutte boeken Google hat geskut yn' e publike biblioteken om har Google Search-sykmasjine te besjen. Foar Google Books Ngram Viewer ferwize se nei de tekst dy't jo sykje as de "corpus". De korpus yn 'e Ngram Viewer wurdt ferdield oer taal, hoewol jo Britsk en Amerikaansk ferlykjen kinne analysearje of se elkoar ophelje. It einiget dat super super is om fan 'e Britske ôf te bringen nei Amerikaanske gebrûk fan termen en sjoch de karlisten feroarje.

Hoe't Ngram wurket

  1. Gean nei Google Books Ngram Viewer by boeken.google.com/ngrams.
  2. Items binne saakensifisearre, yn tsjinstelling ta Google web-sykaksjes, dus derfoar soargje dat jo eigenskiplike haadwurden kapitalisearje.
  3. Typ yn ien wurd of útdrukking dy't jo analysearje wolle. Soargje derfoar dat elke foarm mei in komma getal wurdt. Google suggerearret, "Albert Einstein, Sherlock Holmes, Frankenstein" om jo te begjinnen.
  4. Fierder, type in datumsfjild. De standert is 1800 oant 2000, mar der binne mear resinte boeken (2011 wie de lêste resinte op Google's dokumintaasje, mar dat kin feroare hawwe.)
  5. Kies in corpus. Jo kinne frjemde talen tekenje of Ingelsk sykje, en neist de standert kiezen kinne jo sjogge hoe dingen as "Ingelsk (2009) of Amerikaansk Ingelsk (2009)" oan 'e boaiem. Dit binne âldere korporaasjes dy't Google sûnt wizige hat, mar jo kinne guon reden hawwe om jo fergeliking te meitsjen tsjin âlde gegevens. De measte brûkers kinne har negearje en fokusje op de lêste korrupsje.
  6. Set jo glêdensnivo. Smoarting ferwiist nei hoe glêd de graf is oan 'e ein. De meast genreve representaasje soe in flugge nivo fan 0 wêze, mar dat kin it lestich wêze om te lêzen. De standert is ynsteld op 3. Meastal moatte jo dit net oanpasse.
  1. Druk op 'e syktocht fan boeken knop. (Jo kinne ek gewoan op 'e sykopdracht ynfiere.)

Wat is Ngram te sjen?

Google Books Ngram Viewer sil in grafyk útjaan dy't it gebrûk fan in bepaalde fraach yn 'e boeken troch de tiid fertsjintwurdiget. As jo ​​mear as ien wurd of in fraz ynfierd hawwe, sille jo kleur kodearre linen sjen om de ferskillende sykwurden te kontrasten. Dit is krekt te wêzen mei Google Trends , mar allinich de syk hat in lingere tiid.

Hjir is in echte libbensbeispiel. Wy binne nijsgjirrich oer wyftige pies. Se wurde neamd yn Laura Ingalls Wilder's Lytse Hûs op 'e Prairie- searje, mar wy hienen nea fan sa'n ding heard. Wy brûke earst Google's websiden om mear te learen oer gewaaklike pearen. Misledigere, wurde se beskôge as ûnderdiel fan 'e Amerikaanske Súdlike koken en binne echt makke fan sûch. Se harkje werom nei tiden as net elkenien fan 'e wike elkenien tagong ta frisse produkten hie. Is dat it hiele ferhaal?

Wy sochten de Google Ngram Viewer, en der binne wat meldingen fan it pie yn sawol de begjin- en lette jierren '10, in soad fan 'e sprekkers yn' e jierren '40, en in tanimmend oantal mienings yn 'e lêste tiden (miskien wat piet nostalgie). probleem mei de gegevens op in flugge nivo fan 3. Der is in plateau oer de meldingen yn 'e jierren '80. Sawol wie it jierliks ​​net in gelikensnûmer fan mieningen fan ien bepaalde pie foar alle jierren fiif jier? Wat der op giet, is dat om't der net in soad boeken publisearre binne yn 'e tiid, en omdat ús gegevens op gat sette, it ferhaal it byld. Wierskynlik wie der ien boek dat neamde doarpsfeart, en it just krekt gemiddeld waard om in spits te foarkommen. Mei it ynstellen fan it glêdjen nei 0, kinne wy ​​sjen dat dit krekt it gefal is. De spike sintra op 1869, en der is in oar spits yn 1897 en 1900.

Hawwe gjinien oer risseltaat de rêch fan 'e tiid prate? Se hawwe wierskynlik praat oer dy pies. Der wiene wierskynlik resepten oer it plak flakke. Se hawwe krekt net skreaun oer har yn boeken, en dat is in beheining fan dizze Ngram sykjes.

Avansearre Ngram sykjes

Tink derom hoe't wy sein hawwe dat Ngrams fan alle soarten ferskillende tekst sykjes bestie? Google soarget dat jo ek in bytsje brochje mei de Ngram Viewer. As jo ​​graach sykje wolle foar fisken it ferbûn ynstee fan it fisk, dan kinne jo dit dwaan troch tagong te brûken. Yn dat gefal wolle jo sykje foar "fish_VERB"

Google befettet in folsleine list fan kommando's dy't jo brûke kinne en oare ferfangen dokuminten op har webside.