Chamnan Longlum
2 june 2015
Big data คือข้อมูลขนาดใหญ่มากๆ ตั้งแต่ Terabyte ขึ้นไป โดยข้อมูลนั้นอาจจะมาจาก log ของ ระบบ , mobile device หรือแม้แต่ข้อมูลชั้นดีอย่าง Social Network ต่างๆ โดยที่ Bigdata จะประกอบด้วย3 ส่วนสำคัญคือ
1. Volume :จำนวนของข้อมูลใหญ่
ข้อมูลในส่วนนี้ถ้าจะยกตัวอย่ างที่เห็นได้ชัดๆเช่นข้อมูลที่ มาจาก social network ไม่ว่าจะเป็น twitter , facebook , instagram หรือจะเป็นข้อมูลการเช็คอินต่ างๆ ข้อมูลจากช่องทางนี้จะเห็นว่ าผู้คนมีการใช้ทุกวัน ตลอดเวลา ทำให้ข้อมูลดังกล่าวมากขึ้นๆ ใหญ่ขึ้นๆ จนต้อมีระบบในการจัดเก็บข้อมู ลขนาดใหญ่ขนาดนั้นได้
2. Variety :ความหลากหลายของข้อมูล
ข้อมูลนี้อาจจะเป็นได้ทั้งตัวอั กษร (text) , SQL , JSON , ข้อมูลการเช็คอินที่เป็นตำแหน่ง ซึ่งจะทำให้แยกประเภทของข้อมู ลต่างๆได้มากขึ้น
3. Velocity : ความเร็วของข้อมูล
ข้อมูลนี้ต้องมีความเร็ว ความสดใหม่ของข้อมูล ซึ่งอาจจะเป็นข้อมูลที่ Real-timeเลยก็ได้ เพื่อใช้ในการวิเคราะห์ข้อมู ลในปัจจุบัน
ทำไมต้อสนใจข้อมูลBig data
เพราะจะทำให้เป็นว่าคนในปัจจุบั นกำลังคิดอะไร ทำอะไร แนวโน้มแบบใหน ซึ่ง Bigdata จะกลายมาเป็นเครื่องมือตัวใหม่ ในการตัดสินใจของธุรกิจได้เลยที เดียว ไม่ว่าจะเป็นภาพลักษ์ มีคนพูดถึงในด้านใหน บวกหรือลบอย่างไร หรือจะเป็นระบบหรือเทคโนโลยีที่ กำลังจะทำธุรกิจนั้น มีประโยชน์ น่าสนใจขนาดใหน ซึ่งก็จะสามารถดูได้จากข้อมูลที ่เก็บมาได้นั่นเอง
คราวหน้าเราจะมาเก็บข้อมูลด้วย software อย่าง ElasticSearch ว่าจะสามารถเก็บข้อมูลจาก Social Network มาประมวลผลได้อย่างไร