ווי צו נוצן 'Ngram Viewer' Tool אין Google Books

א Ngram, אויך אָפט גערופן אַן N-gram, איז אַ סטאַטיסטיש אַנאַליסיס פון טעקסט אָדער רייד צופרידן צו געפינען n (אַ נומער) פון עטלעכע סאָרט פון נומער אין דעם טעקסט. עס קען זיין אַלע סאָרץ פון זאכן, ווי פאָנעמעס, פּרעפיקסעס, פראַסעס, אָדער אותיות. כאָטש די N-גראַם איז עפּעס ומקלאָר אַרויס פון פאָרשער, עס איז פאקטיש געניצט אין אַ פאַרשיידנקייַט פון פעלדער, און עס האט אַ פּלאַץ פון ימפּלאַקיישאַנז פֿאַר מענטשן וואָס געמאכט קאָמפּיוטער מגילה וואָס פֿאַרשטיין און ענטפֿערן מיט נאַטירלעך גערעדט שפּראַך. אַז, אין אַ נושעל, וואָלט זיין Google ס אינטערעס אין דער געדאַנק.

אין דעם פאַל פון Google ספר נגראַם וויוער, די טעקסט צו זיין אַנאַלייזד קומט פון דער וואַסט סומע פון ​​ביכער גוגל האט סקאַנד אין פון ציבור לייברעריז צו באַפרייַען זייער Google ספר זוך ענגינעער. פֿאַר Google ספר נגראַם וויוער, זיי אָפּשיקן צו די טעקסט איר זענען געגאנגען צו זוכן ווי די "קאָרפּוס." די קאָרראַל אין די נגראַם וויוער זענען צעטיילט דורך שפּראַך, כאָטש איר קענען סעפּראַטלי אַנאַליסיס בריטיש און אמעריקאנער ענגליש אָדער לאמפּ זיי צוזאַמען. עס ענדס אַרויף זייַנען יבער טשיקאַווע צו מאַכנ זיך פון בריטיש צו אמעריקאנער באַניץ פון טערמינען און זען די טשאַרץ ענדערונג.

ווי נגראַם וואָרקס

  1. גיין צו Google Books Ngram Viewer בייַ books.google.com/ngrams.
  2. זאכן זענען פאַל-שפּירעוודיק, ניט ווי Google וועב אָנפֿרעגן, אַזוי זיין זיכער צו קאַפּאַטאַלייז געהעריק נאַונז.
  3. אַרייַן קיין פֿראַזע אָדער פראַסעס איר ווילט פונאַנדערקלייַבן. זייט זיכער צו באַזונדער יעדער פראַזע מיט אַ קאָמע. Google סאַגדזשעסץ, "Albert Einstein, Sherlock Holmes, Frankenstein" צו באַקומען איר סטאַרטעד.
  4. ווייַטער, טיפּ אין אַ דאַטע קייט. די פעליקייַט איז 1800-2000, אָבער עס זענען מער פריש ביכער (2011 איז געווען די מערסט לעצטנס ליסטעד אין Google ס דאַקיאַמענטיישאַן, אָבער עס קען זיין געביטן.)
  5. קלייַבן אַ קאָרפּוס. איר קענען זוכן פרעמד שפּראַכן אָדער ענגליש, און אין דערצו צו די נאָרמאַל ברירות, איר קען באַמערקן אַזאַ ווי "ענגליש (2009) אָדער אמעריקאנער ענגליש (2009)" אין די דנאָ. דאס איז עלטערע קאָרפּאָראַציע אַז Google האָט זינט דערהייַנטיקט, אָבער איר קען האָבן עטלעכע סיבה צו מאַכן דיין פאַרגלייַך קעגן אַלט דאַטן שטעלט. רובֿ ניצערס קענען איגנאָרירן זיי און פאָקוס אויף די לעצטנס קאָרפּאָראַ.
  6. שטעלן דיין סמודינג מדרגה. סמודינג רעפערס צו ווי גלאַט די גראַפיק איז אין די סוף. די מערסט פּינטלעך פאַרטרעטונג וואָלט זיין אַ סמודינג מדרגה פון 0, אָבער עס קען זיין שווער צו לייענען. די פעליקייַט איז באַשטימט צו 3. אין רובֿ קאַסעס, איר טאָן ניט דאַרפֿן צו סטרויערן דעם.
  1. פּרעסע די זוכן גורל פון ביכער קנעפּל. (איר קענען אויך פּונקט שלאָגן אַרייַן אין די זוכן פּינטלעך.)

וואָס איז נגראַם ווייַזונג?

Google Books Ngram Viewer וועט רעזולטאַט אַ גראַפיק וואָס רעפּראַזענץ די נוצן פון אַ באַזונדער פראַזע אין ביכער דורך צייַט. אויב איר האָבן אריין מער ווי איין וואָרט אָדער פראַזע, איר וועט זען קאָליר-קאָדעד שורות צו קאַנטראַסט די פאַרשידענע זוכן טערמינען. דאָס איז שיין ענלעך צו Google טרענדס , נאָר דער זוכן קאָווערס אַ לאַנג צייַט.

דאָ ס אַ פאַקטיש-לעבן בייַשפּיל.ווע זענען טשיקאַווע וועגן עסיק פּיעס לעצטנס. זיי זייַנען דערמאנט אין לאַוראַ ינגאַללס וואָלדער 'ס קליינע הויז אויף די פּרערי סעריע, אָבער מיר'ד קיינמאָל געהערט פון אַזאַ אַ זאַך. מיר ערשטער געוויינט Google ס וועב זוכן צו לערנען מער וועגן עסיק פּיעס. משמעות, זיי זענען געהאלטן טייל פון אמעריקאנער סאָוטהערן קוויזין און טאַקע זענען געמאכט פון עסיק. זיי הערן צוריק צו מאָל ווען ניט אַלעמען האט צוטריט צו פריש פּראָדוצירן אין אַלע מאל פון די יאָר. איז אַז די גאנצע געשיכטע?

מיר זוכן Google Ngram Viewer, און עס זענען עטלעכע מענטיאָנס פון די פּיראָג אין ביידע פרי און שפּעט 1800 ס, אַ פּלאַץ פון דערמאנט אין די 1940 ס, און אַן ינקריסינג נומער פון דערמאנט אין לעצטע צייט (טאָמער עטלעכע פּיראָג נאָוסטאַלגיאַ.) נו, עס ס עטלעכע פּראָבלעם מיט די דאַטן בייַ אַ סמודינג מדרגה פון 3. עס איז אַ פּלאַטאָ איבער די דערמאנט אין די 1800 ס. שורלי דאָרט געווען ניט אַן נומער פון מענטיאָנס פון איין באַזונדער פּיראָג יעדער יאָר פֿאַר פינף יאר? וואָס ס געגאנגען אויף איז אַז ווייַל עס זענען נישט אַ פּלאַץ פון ביכער פארעפנטלעכט אין דעם צייַט, און ווייַל אונדזער דאַטן איז באַשטימט צו גלאַט, עס דיסאָרץ די בילד. מיסטאָמע עס איז געווען איינער בוך אַז דערמאנט עסיק פּיראָג, און עס נאָר גאַט אַוורידזשד צו ויסמייַדן אַ נאָגל. דורך באַשטעטיקן די סמודינג צו 0, מיר קענען זען אַז דאָס איז פּונקט דער פאַל. די ספּייק סענטערס אויף 1869, און דאָרט ס אנדערן ספּייק אין 1897 און 1900.

האט קיינער רעדן וועגן עסיק פּיעס די מנוחה פון די צייַט? זיי מיסטאָמע האט גערעדט וועגן די פּיעס. עס זענען מסתּמא רעסאַפּיז פלאָוטינג אַלע איבער דעם אָרט. זיי נאָר טאָן נישט שרייַבן וועגן זיי אין ביכער, און אַז ס אַ לימיטירונג פון די נגראַם אָנפֿרעגן.

אַוואַנסירטע נגראַם זוך

געדענקט ווי מיר געזאגט אַז Ngrams קען צונויפשטעלנ זיך פון אַלע סאָרץ פון פאַרשידענע טעקסט אָנפֿרעגן? גוגל אַלאַוז איר צו בויען אַ ביסל מיט די Ngram Viewer ווי געזונט. אויב איר'ד ווי צו זוכן פֿאַר פיש די ווערב אַנשטאָט פון פיש די נאָמען, איר קענען טאָן אַזוי דורך ניצן טאַגס. אין דעם פאַל, איר'ד זוכן פֿאַר "פיש_ווערב"

Google גיט אַ גאַנץ רשימה פון קאַמאַנדז איר קענען נוצן און אנדערע אַוואַנסירטע דאַקיומענטיישאַן אויף זייער וועבזייַטל.