וואָס איר דאַרפֿן צו וויסן וועגן בעאַסעסיאַן ספּאַם פילטערינג

געפינען אויס ווי סטאַטיסטיק העלפן האַלטן דיין ינבאָקס ריין

בייַעסיאַן ספּאַם פילטערס רעכענען די מאַשמאָעס פון אַ אָנזאָג זייַענדיק ספּאַם באזירט אויף זייַן אינהאַלט. ניט ענלעך סימפּלי אינהאַלט-באזירט פילטערס, בייַעסיאַן ספּאַם פֿילטרירונג לערנט פון ספּאַם און פון גוט פּאָסט, ריזאַלטינג אין אַ זייער געזונט, אַדאַפּטינג און עפעקטיוו אַנטי-ספּאַם צוגאַנג אַז, בעסטער פון אַלע, קערט קוים פאַלש positive.

ווי טאָן איר רעקאָגניטירן דזשונק עמאַיל?

טראַכטן וועגן ווי איר דעטעקט ספּאַם . א שנעל בליק איז אָפט גענוג. איר וויסן וואָס ספּאַם קוקט ווי, און איר וויסן וואָס גוט פּאָסט קוקט ווי.

די מאַשמאָעס פון ספּאַם קוקן ווי גוט פּאָסט איז אַרום ... נול.

סקאָרדינג אינהאַלט-באַזירט פילטערס טאָן נישט אַדאַפּט

וואָלט עס נישט זיין גרויס ווען אָטאַמאַטיק ספּאַמ פילטערס געארבעט ווי אַז?

סקאָרינג צופרידן-באזירט ספּאַם פילטערס פּרובירן נאָר אַז. זיי קוקן פֿאַר ווערטער און אנדערע טשאַראַקטעריסטיקס טיפּיש פון ספּאַם. יעדער כאַראַקטער עלעמענט איז אַסיינד אַ כעזשבן, און אַ ספּאַם פּאַרשוין פֿאַר דער גאנצער אָנזאָג איז קאַמפּיוטיד פון די יחיד סקאָרז. עטלעכע סקאָרינג פילטערס אויך קוקן פֿאַר קעראַקטעריסטיקס פון לאַדזשיטאַמאַט פּאָסט, לאָוערינג די לעצט כעזשבן אָנזאָג.

די סקאָרינג פילטערס אַפּפּראָוועס אַרבעט, אָבער עס אויך האט עטלעכע דיסאַדוואַנטידזשיז:

Bayesian Spam Filters טוויק זיך, באַקומען בעסער און בעסער

בייַעסיאַן ספּאַם פילטערס ביסט אַ סאָרט פון סקאָרינג צופרידן-באזירט פילטערס אויך. זייער צוגאַנג איז אַוועק מיט די פראבלעמען פון פּשוט סקאָרינג ספּאַם פילטערס, כאָטש, און עס טוט אַזוי ראַדיקאַלי. זינט די שוואַכקייַט פון סקאָרינג פילטערס איז אין די מאַניואַלי געבויט רשימה פון קעראַקטעריסטיקס און זייער סקאָרז, דעם רשימה איז ילימאַנייטאַד.

אַנשטאָט, בייַעסיאַן ספּאַם פילטערס בויען די רשימה זיך. ידעאַללי, איר אָנהייבן מיט אַ (גרויס) בינטל פון ימיילז וואָס איר האָט קלאַסאַפייד ווי ספּאַם, און אן אנדער בינטל פון גוט פּאָסט. די פילטערס קוקן בייַ ביידע און פונאַנדערקלייַבן די לאַדזשיטאַמאַט פּאָסט ווי געזונט ווי די ספּאַם צו רעכענען די מאַשמאָעס פון פאַרשידן קעראַקטעריסטיקס וואָס זענען ארויס אין ספּאַם, און אין גוט פּאָסט.

ווי אַ בייַעסיאַן ספּאַם פֿילטריר יגזאַמז אַ בליצפּאָסט

די טשאַראַקטעריסטיקס אַ בייַעסיאַן ספּאַם פילטער קענען זיין געזען אין:

אויב אַ וואָרט, "קאַרטעסיאַן" פֿאַר בייַשפּיל, קיינמאָל אויס אין ספּאַם אָבער אָפט אין די לאַדזשיטאַמאַט email איר באַקומען, די מאַשמאָעס אַז "קאַרטעסיאַן" ינדיקייץ ספּאַם איז נאָענט נול. "טאָנער", אויף די אנדערע האַנט, איז אויסשליסלעך, און אָפט, אין ספּאַם. "טאָנער" האט אַ זייער הויך מאַשמאָעס פון זייַענדיק געפונען אין ספּאַם, ניט פיל ונטער 1 (100%).

ווען אַ נייַע אָנזאָג קומט, עס איז פונאַנדערקלייַבן דורך די בייעסיאַן ספּאַם פילטער, און די מאַשמאָעס פון די גאַנץ אָנזאָג זייַענדיק ספּאַם איז קאַלקיאַלייטיד ניצן די יחיד טשאַראַקטעריסטיקס.

אָננעמען אַ אָנזאָג כּולל ביידע "קאַרטעסיאַן" און "טאָונער". פון די ווערטער אַליין עס איז נישט נאָך קלאָר צי מיר האָבן ספּאַם אָדער לעגיטימע פּאָסט. אנדערע קעראַקטעריסטיקס וועלן (האָפפאַלי און רובֿ מיסטאָמע) אָנווייַזן אַ מאַשמאָעס אַז אַלאַוז די פילטער צו קלאַסיפיצירן די אָנזאָג ווי אָדער ספּאַם אָדער גוט פּאָסט.

בייַעסיאַן ספּאַם פילטערס קענען לערן אויטאָמאַטיש

איצט אַז מיר האָבן אַ קלאַסאַפאַקיישאַן, דער אָנזאָג קענען זיין געניצט צו באַן די פילטער זיך ווייַטער. אין דעם פאַל, אָדער דער מאַשמאָעס פון "קאַרטעסיאַן" ינדיקייץ גוט פּאָסט איז לאָוערד (אויב דער אָנזאָג מיט ביידע "קאַרטעסיאַן" און "טאָונער" איז געפונען צו זיין ספּאַם), אָדער דער מאַשמאָעס פון "טאָונער" וואָס ינדיקייץ ספּאַם זאָל זיין יבערקוקן.

ניצן דעם אַוטאָ-אַדאַפּטיווע טעכניק, בייַעסיאַן פילטערס קענען לערנען פון ביידע זייער אייגן און די דיסיזשאַנז פון די באַניצער (אויב איר מאַניואַלי קערעקץ אַ מיסדזשאַדזשמאַנט דורך די פילטערס). די אַדאַפּטאַבילאַטי פון בייַעסיאַן פֿילטרירונג אויך מאכט זיכער זיי זענען רובֿ עפעקטיוו פֿאַר די יחיד email באַניצער. בשעת רובֿ מענטשן ס ספּאַם קען האָבן ענלעך קעראַקטעריסטיקס, די לאַדזשיטאַמאַט פּאָסט איז קעראַקטעריסטיקלי אַנדערש פֿאַר יעדער.

ווי קענען ספּאַממערס באַקומען פאַרגאַנגענהייט בייַעסיאַן פילטערס?

די קעראַקטעריסטיקס פון לאַדזשיטאַמאַט פּאָסט זענען פּונקט ווי וויכטיק פֿאַר די בייַעסיאַן ספּאַם פילטערינג פּראָצעס ווי די ספּאַם. אויב די פילטערס זענען ספּיננינג ספּאַסיפיקלי פֿאַר יעדער באַניצער, ספּאַממערס וועלן אַפֿילו אַפֿילו האַרדער צייַט ארבעטן אַרום אַלע (אָדער אַפֿילו רובֿ מענטשן ס) ספּאַם פילטערס, און די פילטערס קענען אַדאַפּט צו כּמעט אַלץ ספּאַממערס.

ספּאַממערס וועט נאָר מאַכן עס פאַרגאַנגענהייַט געזונט-טריינד בייַעסיאַן פילטערס אויב זיי מאַכן זייער ספּאַם אַרטיקלען קוק בישליימעס ווי דער פּראָסט בליצפּאָסט יעדער קען באַקומען.

ספּאַממערס טאָן ניט יוזשאַוואַלי שיקן אַזאַ פּראָסט ימיילז. זאל אונדז יבערנעמען דאָס איז ווייַל די ימיילז טאָן ניט אַרבעטן ווי אָפּפאַל email. אַזוי, גיכער זענען זיי וועט ניט זיין טאן ווען פּראָסט, נודנע ימיילז זענען די בלויז וועג צו מאַכן עס פאַרגאַנגענהייַט ספּאַם פילטערס.

אויב ספּאַממערס טאָן באַשטימען צו רובֿ פּראָסט-קוקן ימיילז, מיר וועלן זען אַ פּלאַץ פון ספּאַם אין אונדזער ינבאָקסעס ווידער, און בליצפּאָסט קען זיין ווי פראַסטרייטינג ווי עס איז געווען אין פאַר-בעאַעסיאַן טעג (אָדער אַפֿילו ערגער). עס וועט אויך זיין רוינד די מאַרק פֿאַר רובֿ מינים פון ספּאַם, כאָטש, און אַזוי וועט ניט זיין לאַנג פֿאַר לאַנג.

שטאַרק ינדיקאַטאָרס קענען זיין אַ בייַעסיאַן ספּאַם פֿילטריר & # 39; s אַטשיללעס & # 39; פּיאַטע

איינער ויסנעם קענען זיין דערקענט פֿאַר ספּאַממערס צו אַרבעטן זייער וועג דורך בייעסיאַן פילטערס אפילו מיט זייער געוויינטלעך צופרידן. עס איז אין דער נאַטור פון בעאַעסיאַן סטאַטיסטיק אַז איינער וואָרט אָדער כאַראַקטעריסטיש אַז זייער אָפט אויס אין גוט פּאָסט קענען זיין אַזוי וויכטיק ווי צו ווענדן קיין אָנזאָג פון קוקן ווי ספּאַם צו זיין רייטאַד ווי שינקע דורך די פילטער.

אויב ספּאַממערס קענען געפֿינען אַ וועג צו באַשטימען דיין זיכער-פֿייַער גוט-פּאָסט ווערטער ניצן HTML כעזשבן ווייזט צו זען וואָס אַרטיקלען וואָס איר געעפנט, פֿאַר בייַשפּיל, זיי קענען אַרייַננעמען איינער פון זיי אין אַ אָפּפאַל פּאָסט און איר באַקומען אפילו דורך אַ געזונט- טריינד בייַעסיאַן פילטער.

יוחנן גראַם-קוממינג האט געפרוווט דעם דורך לעטינג צוויי בייעסיאַן פילטערס אַרבעט קעגן יעדער אנדערע, די "שלעכט" איינער אַדאַפּטינג צו וואָס אַרטיקלען זענען געפונען צו באַקומען דורך די "גוט" פילטער. ער זאגט עס אַרבעט, כאָטש דער פּראָצעס איז צייַט-קאַנסומינג און קאָמפּליצירט. מיר טאָן ניט טראַכטן מיר וועלן זען אַ פּלאַץ פון דעם געשעעניש, אין מינדסטער נישט אויף אַ גרויס וואָג, און נישט צוטיילן צו בליצפּאָסט קעראַקטעריסטיקס מענטשן. ספּאַממערס זאל (פּרובירן צו) רעכענען עטלעכע טערמינען פֿאַר אָרגאַנאַזיישאַנז (עפּעס ווי "אַלמאַדען" פֿאַר עטלעכע מענטשן בייַ יבם אפֿשר?) אַנשטאָט.

וסואַללי, ספּאַם וועט שטענדיק זיין (באטייטיק) אַנדערש פון רעגולער פּאָסט אָדער עס וועט נישט זיין ספּאַם, כאָטש.

די דנאָ שורה: בייעסיאַן פילטערינג שטאַרקייַט קענען זיין זייַן שוואַך

בייַעסיאַן ספּאַם פילטערס זענען צופרידן-באזירט פילטערס אַז: