מעטאַ טשאַרסעט טאַג אין HTML5

באַשטעטיקן טשאַראַקטער סיסטעם אין HTML5

פריערדיק צו די הקדמה פון הטמל 5, סעטטינג די כאַראַקטער קאָדירונג אויף אַ דאָקומענט מיט אַ עלעמענטקווירעדיאָו צו שרייַבן די עפּעס ווערבאָוזע שורה געזען אונטן. דאס איז די מעטאַ טשאַרסעט עלעמענטן אויב איר האָט ניצן HTML4 אין דיין וועב בלאַט:

<מעטאַ http- equiv = "צופרידן-טיפּ" צופרידן = "טעקסט / HTML, טשאַרסעט = יסאָ -8859-1">

וואָס איז וויכטיק צו באַמערקן אין דעם קאָדאַרע די ציטאַט מאַרקס איר זען אַרום דעם צופרידן אַטריביוט: צופרידן = " טעקסט / HTML, טשאַרסעט = יסאָ -8859-1 " . ווי אַלע HTML אַטראַביוץ, די ציטאַט מאַרקס באַשטימען די ווערט פון די אַטריביוט, ינדאַקייטינג אַז די גאנצע שטריקל טעקסט / HTML; טשאַרסעט = יסאָ -8959-1 איז דער אינהאַלט פון דעם עלעמענט.טהיס איז געהעריק HTML און עס איז ווי דעם שטריקל איז געווען מענט צו זיין געשריבן. עס איז אויך אַנווילדיי לאַנג און מיעס! עס ס אויך נישט וואָס איר וואָלט מסתּמא געדענקען אַוועק די שפּיץ פון דיין קאָפּ! אין רובֿ פאלן, וועב דעוועלאָפּערס וואָלט האָבן צו צייכענען און פּאַפּ דעם קאָד פון איין פּלאַץ אין קיין נייַע זיי זענען דעוועלאָפּינג ווייַל שרייבן דעם פון קראַצן איז אַסקינג אַ פּלאַץ.

HTML5 Cuts Out the Extra # 34; Stuff & # 34;

HTML5 האט ניט בלויז צוגעלייגט אַ נומער פון נייַע עלעמענטן צו דער שפּראַך, אָבער עס אויך זייער סימפּליפיעד די סינטאַקס פון HTML, אַרייַנגערעכנט די מעטאַ טשאַרסעט עלעמענט.וויטה HTML5, איר קענען לייגן דיין כאַראַקטער קאָדירונג מיט די פיל גרינגער צו געדענקען סינטאַקס פאָר די מעטאַ עלעמענט וואָס איר זען אונטן:

פאַרגלייַכן אַז סימפּלאַפייד סינטאַקס צו וואָס מיר געשריבן אין די אָנהייב פון דעם אַרטיקל, די אַלט סינטאַקס געניצט פֿאַר HTML4, און איר וועט זען ווי פיל גרינגער צו שרייַבן און געדענקען די HTML5 ווערסיע טאַקע איז. אַנשטאָט פון וואָס איר דאַרפֿן צו צייכענען און פּאַפּ דעם פון אַ יגזיסטינג פּלאַץ אין קיין נייַ איינער איר אַרבעט אויף, דאָס איז לעגאַמרע עפּעס וואָס, ווי אַ פראָנט-סוף וועב דעוועלאָפּער, איר קען געדענקען. דעם סייווינגז פון צייַט פילע נישט זיין פיל, אָבער ווען איר באַטראַכטן די אנדערע סינטאַקס געביטן אַז HTML5 סימפּלאַפייד, די סייווינגז טאָן לייגן אַרויף!

שטענדיק אַרייַננעמען די טשאַראַקטער ענדינג

איר זאָל שטענדיק כולל כאַראַקטער קאָדירונג פֿאַר דיין וועב זייַטלעך, אַפֿילו אויב איר טאָן ניט אלץ בדעה צו קלאָוזיז קיין ספּעציעלע אותיות . אויב איר טאָן ניט אַרייַננעמען אַ סימבאָל קאָדירונג, דיין פּלאַץ ווערט שפּירעוודיק צו אַ קרייַז פּלאַץ סקריפּטינג באַפאַלן ניצן UTF-7.

אין דעם סצענאַר, אַן אַטאַקערער זעט אַז דיין פּלאַץ האט קיין ייטאַמז קאָדירונג דיפיינד, אַזוי עס טריקס דעם בלעטערער אין טראכטן אַז די סימפּלע קאָדירונג פון די בלאַט איז פאקטיש UTF-7. ווייַטער, די אַטאַקער ינווייץ UTF-7 קאָדעד סקריפּס אין די וועב בלאַט און דיין פּלאַץ איז כאַקעד.טהיס איז דאָך פּראָבלעמאַטיק פֿאַר אַלעמען ינוואַלווד, פון דיין פירמע צו דיין וויזאַטערז. דער גוט נייַעס איז אַז עס איז אַ פּשוט פּראָבלעם צו ויסמייַדן - נאָר זיין זיכער צו לייגן די סימפּלע קאָד צו אַלע אייער וועבפּאַגעס.

ווו צו לייגן טשאַראַקטער ענדינג

די כאַראַקטער קאָדירונג פֿאַר אַ וועבפּאַגע זאָל זיין די ערשטער שורה פון דיין HTML ס <קאָפּ> עלעמענט.טהיס ינשורז אַז דער בלעטערער ווייסט וואָס די סימפּלע קאָדירונג איז איידער עס טוט עפּעס אַנדערש אויף די בלאַט אנדערע ווי צו באַשטימען די דאָקטיפּע און ידענטיפיצירן אַז עס איז אַן HTML בלאַט. דיין HTML זאָל לייענען:

<קאָפּ> <מעטאַ טשאַרסעט = "UTF-8"> ...

ניצן הטטפּ כעדערז פֿאַר עקסטרע זיכערהייַט

איר קענען אויך ספּעציפיצירן די כאַראַקטער קאָדירונג אין די הטטפּ כעדערז. דאָס איז אַפֿילו מער זיכער ווי צו לייגן דעם HTML בלאַט, אָבער איר ווילד צו האָבן צוטריט צו די סערווער קאַנפיגיעריישאַנז אָדער. הטאַקסעסס טעקעס, וואָס מיטל איר קען דאַרפֿן צו אַרבעטן מיט דעם האָסטינג שפּייַזער פון דיין וועבזייַטל צו געווינען דעם טיפּ פון צוטריט אָדער האָבן זיי מאַכן די ענדערונגען פֿאַר איר. אַקסעס איז טאַקע די אַרויסרופן דאָ. דער ענדערונג זיך איז פּשוט, אַזוי קיין האָסטינג שפּייַזער זאָל זיין ביכולת צו מאַכן דעם ענדערונג פֿאַר דיין מיט קאָרעוו יז.

אויב איר נוצן Apache, איר קענען שטעלן די פעליקייַט שריפֿטצייכן פֿאַר דיין גאנצע פּלאַץ דורך צו לייגן: AddDefaultCharset UTF-8 צו דיין וואָרצל. הטאַקסעסס טעקע. אַפּאַטשי ס פעליקייַט כאַראַקטער שטעלן איז ISO-8859-1 .