แก้ปัญหา charset ของ mysql กับปัญหาภาษาไทยอ่านไม่ออก?

ก่อนอื่นมาทำความเข้าใจกับระบบ charset กันก่อนครับ
เดิมที่ระบบการเก็บข้อมูลของ mysql เวอร์ชั่นต่ำกว่า 4.0.xx จะเป็นการเก็บแบบ ascii แล้วใช้ charset เป็นตัวกำหนดภาษา
กล่าวคือแต่ละตัวอักษรจะใช้พื้นที่ในการเก็บ 1 byte เป็นค่า 0-255 และใช้ charset มาเป็นตัวกำหนดว่าจะเอาตารางตัวอักษรของภาษาใหนมาใช้ ซึ่งค่าที่เก็บอยู่ในตารางก็จะเป็น 0-255 เหมือนเดิม
ดังนั้นจึงไม่มีปัญหาเรื่องภาษาไทยกับ mysql เวอร์ชั่นต่ำกว่า 4.0.xx หากการแสดงผลไม่เป็นภาษาไทย ก็แค่เลือก encoding ของ browser ให้เป็น windows-874 หรือ tis-620 ก็จะแสดงได้ถูกต้อง ซึ่งข้อจำกัดคือสามารถแสดงผลได้เพียง 255 รูปแบบตัวอักษร
ตาม charset ที่นำมาใช้

ตั้งแต่ mysql เวอร์ชั่น 4.1.xx (จริงๆเริ่มที่ 4.0.??) ขึ้นมาจะรองรับการเก็บข้อมูลแบบ unicode ซึ่งจะมีการเก็บ charset ไว้ด้วย ดังนั้น
การเก็บข้อมูลของ 1 ตัวอักษรจะใช้พื้นที่อย่างน้อย 2 byte ขึ้นไป ดังนั้นการแสดงผลแต่ละตัวอักษรสามารถแสดงออกมาตาม charset ที่ระบุไว้ของตัวอักษรนั้นๆ ทำให้สามาถแสดงผลได้ทุกภาษาที่ต้องการพร้อมๆกันในหน้าเดียว

สำหรับภาษาไทยในเวอร์ชั่น 4.1 ที่ compatible กับ 4.0 ก็คือการเก็บภาษาไทยแบบ ascii ลงในตาราง latin1-swedish
ซึ่งในการใช้งานกับ 4.1 สามารถใช้งานได้เหมือนกับการใช้งานบน 4.0 ทุกประการ
sql ที่ export มาจาก 4.0 นำมา import ลงบน 4.1 แบบ latin1 จะสามารถแสดงผลบน browser ที่เลือก charset เป็น tis-620 ได้ทันที โดยไม่ต้องมีการแปลงใดๆ

การใช้ภาษาไทยแบบ unicode บน mysql 4.1
จะเป็นการเก็บภาษาไทยในรหัส unicode บนตารางแบบ utf8_unicode หรือ tis620_unicode ซึ่งไม่ใช่ latin1_swedish
สำหรับเวบที่เริ่มต้นสร้าง database ใหม่บน mysql4.1 โดยสร้างเป็นแบบ tis620_unicode หรือ utf8 ก็จะสามารถบันทึกและแสดงผลภาษาไทยได้อย่าวไม่มีปัญหา เนื่องจากตัว mysql จะ connect db นั้นๆตาม charset ที่สร้างไว้

แล้วปัญหาภาษาไทยอ่านไม่ออกเกิดจากอะไร?
ปัญหานี้มักเกิดจากการ export แล้วมา import จากระบบหนึ่งมายังอีกระบบหนึ่ง ซึ่งใช้ charset ไม่สอดคล้องสัมพันธ์กัน
เช่นนำ sql ที่ export จาก mysql4.0 มา import เข้า mysql4.1 แบบ tis620_unicode แทนที่จะเป็น latin1_swedish
ก็จะเกิดปัญหาภาษาไทยกลายเป็น ???

การ export และ import database
ก่อนอื่นให้ตรวจสอบข้อมูลเบื้องต้นต่อไปนี้

[color=blue]1. Version ของ mysql ต้นทาง
2. Version ของ phpmyadmin ต้นทาง
3. Charset ของ DB และ Table ต้นทาง

  1. Version ของ mysql ปลายทาง
  2. Version ของ phpmyadmin ปลายทาง
  3. Charset ของ DB ปลายทาง ทีเ่กิดจากการสร้าง db เปล่าๆขึ้นมาผ่าน cp
    [/color]
    ควรระบุข้อมูล 6 ข้อข้างบนให้ครบเวลามาถามปัญหา เพื่อจะได้บอกวิธีแก้ได้ถูกต้อง
    เมื่อมีข้อมูลข้างต้นก็จะสามารถบอกได้ว่า

1. จะต้อง export ไฟล์ sql ด้วย charset อะไร หรือใช้ phpmyadmin เวอร์ชั่นใหม่หรือเก่าช่วยในการ export
2. charset ของ db ที่จะต้องแก้ไขหลังจากสร้าง db ขึ้นมาก่อนทำการ import ข้อมูล
3. charset ที่จะต้องเลือกในการ import ข้อมูลจากไฟล์ sql ที่มีอยู่

หลักการ convert charset
สามารถทำได้บน mysql 4.1 ขึ้นไป โดยทำการแปลงจาก charset ปัจจุบันให้เป็น binary ก่อนแล้วจึงแปลงไปเป็น charset ที่ต้องการ
โดยใช้เมื่อทำการ import ข้อมูลภาษาไทยลงในตารางที่มี charset ไม่ตรงกับข้อมูล ไปเป็น charset ที่ตรงกับข้อมูล

[hr]
ตัวอย่าง
เมื่อทำการ export / import ข้อมูลในเครื่องเดียวกัน บน mysql 4.1 charset latin1 ด้วย phpmyadmin และ charset ต่างๆกัน
[b]ไฟล์ SQL Export ไว้ด้วย

ขอบคุณมากๆ ครับคุณแมน เป็นบทความที่ มีประโยชน์ มากๆ เลยครับ +1 ครับ

อยากจะ +1 ให้บ้าง
แต่ว่ามันบวกตรงไหนเหรอครับ ??

ขออนุญาตเก็บไว้นะครับ

ใครมีประสบการณ์ในการ import export อย่างไรก็นำผลลัพธ์ มาโพสต์กันได้ครับ

โฮสเก่าเป็น mysql xx ใช้ charset xx export มาด้วย charset xx ผ่าน phpmyadmin ver xx
แล้วมา import ที่โฮสใหม่ที่เป็น mysql xx ใช้ charset xx ด้วย phpmyadmin ver xx หรือ bigdump หรือ …
ได้ผลลัพธ์เป็น ~~~ / ???

เป็นประโยชน์อย่างมาก ขอบคุณครับ

ขอบคุณครับ

โอ้พี่ ขอบคุณมากเลยครับ เดียวจะลองทำดูครับ

ขอบคุณครับ

lol

สุดยอด…

ขอบคุณครับ

ประสบการณ์ของผมส่วนใหญ่จะเป็นการ backup ผ่านสคริป ที่ต้องได้ DB ออกมาเป็นภาษาไทยครับ แล้ว import เข้า phpmyadmin ผ่าน tis620 ก็จะเป็นไทยดังเดิม

สงสัยครับ ถ้าิ export ออกมาแล้วมันเป็นภาษาที่อ่านไม่ออกล่ะครับ จะทำไง

จะมีวิธีแก้ไขอย่างไรในขั้นตอนการ export ได้บ้างครับ

:blush:

ถ้า export มาแล้วเปิดอ่านด้วย editplus แล้วอ่านไม่ออกอย่าเพิ่งตกใจครับ ลอง import เป็น utf8 ดูก่อน

[quote]PhpMyadmin 2.7.2 (Latin1)

แต้งซะกิ้วครับพี่แมน มึนอยู่หลายวัน กับปัญหาโลกแตกกกก

author=kke link=topic=6764.msg63297#msg63297 date=1181192289]
ถ้า export มาแล้วเปิดอ่านด้วย editplus แล้วอ่านไม่ออกอย่าเพิ่งตกใจครับ ลอง import เป็น utf8 ดูก่อน

เปิดออกมาแล้ว มันไม่เป็นภาษาไทยอะครับ ต้องทำยังไงครับ

สอบถามครับ
phpMyAdmin 2.5.4
export

[quote author=ไทยโฮสทูเดย์ link=topic=6764.msg63361#msg63361 date=1181217873]
สอบถามครับ
phpMyAdmin 2.5.4
export

ต้องดูที่ server charset, server collation ด้วยครับ

[quote author=ไทยโฮสทูเดย์ link=topic=6764.msg63361#msg63361 date=1181217873]
สอบถามครับ
phpMyAdmin 2.5.4
export

:sleep:

ลองสร้าง database ว่างๆผ่าน cp ขึ้นมา 1 อัน
แล้วเข้าไปดูใน phpmyadmin ครับว่าเป็น collation อะไร
(เลือกที่ชื่อ db แล้วเข้าไปที่หน้า operations หรือ กระบวนการ)
สามารถเปลี่ยน collation ได้จากหน้านี้ ถ้าเป็น tis620 อยู่ ก็ลองเปลี่ยนเป็น latin1
แล้วจึงค่อยทำการ import sql ดูครับ