รับทําเว็บไซต์ รับทําseo
บทความที่น่าสนใจ

บทความ ที่น่าสนใจ

UTF-8 คืออะไร ทำไมถึงนิยมใช้ UTF-8 ?

    สำหรับการทำเว็บที่เป็นภาษาไทยที่นิยมคือ TIS-620 และ WINDOWS-874 และ UTF-8 ซึ่งปัจจุบัน TIS-620 และ WINDOWS-874 นั้นคนใช้น้อยมากแล้วเพราะติดข้อจำกัดทางเทคนิค ทำให้ส่วนใหญ่หันไปใช้ UTF-8

    tis-620
    tis-620 เป็นที่ยอมรับกันในมาตรฐานสากล ประเทศไทยมีมาตรฐานอักขระซึ่งกำหนดโดย สำนักงานมาตรฐานอุตสาหกรรม ดังที่เรียกกันโดยทั่วไปว่ารหัส สมอ. แต่รหัส สมอ. หรือที่มีชื่อทางการว่า มอก.620 หรือ TIS-620 นี้ เป็นมาตรฐานของประเทศไทย ซึ่งเมื่อนำไปใช้บนเครือข่ายอินเทอร์เน็ต ก็อาจเกิดความเข้าใจไม่ตรงกันได้ ดังนั้นจึงมีความพยายามที่จะจดทะเบียน รหัส สมอ. ที่ Internet Assigned Numbers Authority (IANA) ซึ่งเป็นผู้ควบคุมมาตรฐานของเครือข่ายอินเทอร์เน็ต และได้ดำเนินการจดทะเบียนจนสำเร็จ เมื่อวันที่ 22 กันยายน 2541

    tis-620 เป็น character set ที่จดทะเบียนถุกต้อง เป็นที่รับรู้กันทั่วโลก ทุกระบบปฏิบัติการ (แม้แต่ระบบปฏิบัติการของไมโครซอฟต์เอง)

    tis-620 มีข้อดีตรงที่ว่า ในช่วงที่เป็นข้อความภาษาไทย ถ้าเป็น UTF-8 จะใช้พื้นที่เยอะกว่าถึง 2-3 เท่าตัว (ตรงภาษาอังกฤษ ใช้พื้นที่เท่าเดิมคือ 1 byte) พื้นที่เยอะ ไม่ได้หมายถึงว่าจะกระทบกับพื้นที่ใน Harddisk อย่างเดียว (Harddisk เราค่อนข้างเหลือเฟืออยู่แล้ว) มันจะมีผลกับการรับส่งข้อมูล 2-3 เท่าตัว ถ้าเป็นหน้าที่ไม่มีอะไร บอกแค่ว่า “ได้รับข้อมูลแล้ว ขอบคุณที่ร่วมกิจกรรม” แค่นี้คงไม่ต่างอะไรมาก แต่ถ้ามันเป็นหน้าที่มีข้อมูลจำนวนเยอะ มีข้อความเยอะมาก อย่างใน Community ใน Webboard อันนี้จะเริ่มเห็นความต่าง ทางด้านความเร็วแล้ว

    windows-874
    ในทางเทคนิคแล้ว windows-874 เป็น character set ที่เป็น superset ของ tis-620 (คำว่า super set หมายถึงว่า อะไรที่ tis-620 มี นั้น windows-874 มี) ดังนั้น เมื่อดูผลที่ออกมาจึงทำงานได้เหมือนกันทุกประการ windows-874 เป็น character set ที่ใช้ภายในระบบปฏิบัติการที่ผลิตโดยบริษัท ไมโครซอฟต์ เท่านั้น ไม่ได้เป็น character set ที่ใช้ในการแลกเปลี่ยนข้อมูลระหว่างเครื่อง

    ถ้านำ ไปใช้ใน การรับส่งข้อมูลระหว่างเครื่อง ระบบปฏิบัติการอื่นจะไม่เข้าใจรหัสเพิ่มเติมเหล่านี้ (และในทำนองเดียวกัน ในระบบปฏิบัติการอื่นๆ ก็จะมีส่วนขยายเพิ่มเติมภายใน ที่ ระบบปฏิบัติการของไมโครซอฟต์ไม่เข้าใจเช่นกัน) การที่ตั้งเป็น windows-874 จะมีผลกับแค่ Browser ที่ทำงานอยู่บนระบบปฏิบัติการของไมโครซอฟต์เท่านั้น
     
    UTF-8
    UTF-8 คือ รหัสภาษานานาชาติ หรือ Unicode เป็นการเข้ารหัสชุดอักขระที่ใช้ชุดข้อมูล 1 ถึง 4 byte เพื่อแทนตัวอักษรเกือบทั้งโลก โดยใช้หลักการใช้ชุดข้อมูลแบบความยาวไม่คงที่ แทนตัวอักขระเป็นชุดๆ ไป

    UTF-8 มีข้อดีตรงที่ว่า ใน 1หน้าเว็บนั้น เราสามารถแสดงผลร่วมกันได้ ในหน้านั้นจะมีภาษาไทย อังกฤษ จีน ญี่ปุ่น ซาอุ สวีเดน ฯลฯ มันแสดงผลร่วมกันได้เลยใน 1 หน้า แต่ถ้าเราเลือกเป็น TIS-620 ตรงภาษาอื่นๆ มันจะอ่านไม่ออกเพราะรหัสนี้มีแค่ ภาษาไทย กับ อังกฤษ

บทความที่น่าสนใจ

บทความ ล่าสุด

บทความ ความรู้ด้านไอที, คอมพิวเตอร์ Techonlogy, Gadget, ความรู้เกี่ยวกับคอมพิวเตอร์ กับทาง SoftMelt.com