ถ้าจะพูดถึง Trend ที่กำลังมามาแรงและเป็นที่พูดถึงในแวดวงไอทีหรือธุรกิจ ต้องเคยได้ยิน Big Data ผ่านหูกันมาบ้างแล้ว บางทีก็สงสัยไหมครับว่า Big Data คืออะไร? ทำไมต้อง Big Data? แล้ว สำคัญอย่างไร?
ในยุคปัจจุบันที่โลกถูกขับเคลื่อนด้วยข้อมูล ยิ่งข้อมูลยิ่งมาก ข้อมูลขนาดใหญ่ บิ๊ก ดาต้า (Big Data) การตัดสินใจต่างๆ ยิ่งถูกต้องและแม่นยำมากยิ่งขึ้น กระบวนการคิดของคนทั่วไปหรือแม้แต่องค์กรต่างๆในทุกวันนี้ส่วนใหญ่อยู่บนฐานของการรวบรวมข้อมูล ประมวลผล เพื่อประกอบการตัดสินใจทำอะไรบางอย่าง
Data คืออะไร
ข้อมูลหรือ Data คือ ค่าของตัวแปรในเชิงคุณภาพหรือเชิงปริมาณ ข้อเท็จจริง ข้อความหรือเรื่องราวที่เกี่ยวข้องกับสิ่งต่าง ๆ โดยอยู่ในรูปแบบที่เหมาะสมต่อการแปลความหมายและการประมวลผลซึ่งข้อมูลอาจจะได้มาจากการสังเกต การเก็บรวบรวม การวัด ข้อมูลเป็นได้ทั้งข้อมูลตัวเลขหรือสัญลักษณ์ใด ๆ ซึ่งถ้าเป็นข้อมูลที่ใช้ในระบบคอมพิวเตอร์ที่สามารถนำไปประมวลผลได้แบ่งได้เป็น
- ข้อมูลตัวเลข (Numeric Data)
- ข้อมูลตัวอักษร (Text Data)
- ข้อมูลเสียง (Audio Data)
- ข้อมูลภาพ (Images Data)
- ข้อมูลภาพเคลื่อนไหว (Video Data)
Big Data คืออะไร
Big Data คือปริมาณข้อมูล(Data)จำนวนมหาศาล ที่เกิดขึ้นแต่ละวัน เช่น ข้อมูลจากการทำธุรกิจ ข้อมูลจากการซื้อขายสินค้า ข้อมูลคนผ่านเข้าออกสถานีรถไฟ หรือ ข้อมูลคนที่ใช้บริการของ facebook ข้อมูลที่มีปริมาณมหาศาลจนซอฟต์แวร์หรือฮาร์ดแวร์ธรรมดานั้นไม่สามารถที่จะจัดการหรือวิเคราะห์ได้อย่างมีประสิทธิภาพ ดังนั้นต้องมีเทคโนโลยีและสถาปัตยกรรมไอทีรุ่นใหม่ ซึ่งอาจมาในรูปแบบซอฟต์แวร์ ที่สามารถรองรับการจัดเก็บ การจัดการ กรองเลือกข้อมูล การวิเคราะห์ แสดงผล และการใช้งานข้อมูลที่มีคุณลักษณะดังต่อไปนี้
คุณลักษณะของ Big Data
Big Data หมายถึงข้อมูลที่มีขนาดใหญ่ เร็ว หรือซับซ้อนจนยากหรือเป็นไปไม่ได้ที่จะประมวลผลโดยใช้วิธีการแบบเดิม ช่วงต้นปีค.ศ. 2000 เมื่อดั๊ก ลานีย์ นักวิเคราะห์อุตสาหกรรมได้ให้คำจำกัดความที่เป็นที่เข้าใจกันในขณะนี้ว่า ข้อมูลขนาดใหญ่ประกอบด้วย
- ปริมาณมาก (Volume) ซึ่งได้จากการที่องค์กรต่างๆ รวบรวมข้อมูลจากหลากหลายแหล่ง ซึ่งรวมถึงธุรกรรมของธุรกิจ อุปกรณ์อัจฉริยะ (IoT) อุปกรณ์อุตสาหกรรม วิดีโอ โซเชียลมีเดีย ซึ่งสามารถเป็นได้ทั้งรูปแบบ Online และ Offline ซึ่งส่วนมากแล้วจะมีปริมาณมากกว่าหน่วย TB (Terabyte) ขึ้นไป
- มีการเปลี่ยนแปลงอย่างรวดเร็ว (Velocity) ด้วยเทคโนโลยีที่ล้ำหน้าขึ้นทุกวัน ความเร็วในการได้รับข้อมูลที่เพิ่มขึ้นและต้องได้รับการจัดการในเวลาที่เหมาะสม ข้อมูลเหล่านี้ในแบบเรียลไทม์ ส่งผ่านข้อมูลกันอย่างต่อเนื่อง (Real-time) จนทำให้การวิเคราะห์ง่ายๆ เกินขีดข้อจำกัด หรือไม่สามารถจับรูปแบบหรือทิศทางของข้อมูลได้
- หลากหลายประเภทหรือแหล่งที่มา (Variety) หมายถึงรูปแบบของข้อมูลที่แตกต่างกันออกไป นับตั้งแต่ข้อมูลที่มีโครงสร้าง ตัวเลขในฐานข้อมูลแบบดั้งเดิม ไปจนถึงเอกสารข้อความ ทั้งในรูปแบบ ตัวอักษร วิดีโอ รูปภาพ ไฟล์ต่างๆ และหลากหลายแหล่งที่มาเช่น Social Network ต่างๆ อีเมล วิดีโอ เสียง ข้อมูลหุ้น และธุรกรรมทางการเงิน
- ยังไม่ผ่านการประมวลผล (Veracity) ข้อมูลที่มีระดับคุณภาพปะปนกันไป ยังไม่ผ่านการ Process ให้อยู่ในรูปแบบของข้อมูลที่สามารถใช้สร้างประโยชน์ต่อองค์กร ซึ่งเป็นข้อมูลที่ยังไม่สมบูรณ์จึงยังไม่สามารถนำไปประกอบการตัดสินใจได้
การวิเคราะห์ข้อมูลขนาดใหญ่
การวิเคราะห์ข้อมูล Big data อาศัยหลักการพื้นฐานบางอย่างเพื่อพัฒนาเป็นเทคนิคในการดึงข้อมูลสำคัญออกจากชุดฐานข้อมูลขนาดใหญ่ที่เต็มไปด้วยข้อมูลหลากหลายรูปแบบ เพื่อนำมาหา pattern ของข้อมูลที่มองไม่เห็นด้วยตาเปล่า หารูปแบบความสัมพันธ์ที่ซ่อนอยู่ หาแนวโน้มการตลาด เทรนด์ความชอบของลูกค้า และข้อมูลอื่นๆที่เป็นประโยชน์ทางธุรกิจ
Big data analytics ต้องการเทคโนโลยีชั้นสูงคือ
AI (Artificial Intelligence) ปัญญาประดิษฐ์ ที่มีการวิเคราะห์เชิงลึก คล้ายความฉลาดของมนุษย์ การทำงานที่เปรียบเสมือนมันสมองที่แทรกอยู่ในเทคโนโลยีและนวัตกรรมต่างๆ ที่นำไปสู่การเพิ่มมูลค่าทางธุรกิจ และตอบโจทย์ความต้องการของผู้บริโภคในอุตสาหกรรมต่างๆ เร็วกว่า และแม่นยำ เกิดจากการประมวลผลจากข้อความรับเข้า แล้วแปลงเป็นการวิเคราะห์ข้อมูลที่ต้องการ
Machine Learning คือการสอนอัลกอริทึมให้เรียนรู้ทำความเข้าใจและตัดสินใจได้ด้วยตัวเองจาก ข้อมูลที่ป้อนให้
Deep Learning วิธีประมวลผลแบบขนาน (parallel processing) เพื่อทำให้มันสามารถเข้าใจและเรียนรู้จากข้อมูลจำนวนมากที่ได้รับอย่างต่อเนื่อง
ซึ่งเทคโนโลยีนำมาประมวลผลข้อมูลเพื่อวิเคราะห์ข้อมูลแล้วนำไปใช้ประโยชน์จากข้อมูลจำนวนมหาศาลที่เข้ามา
Big data มีประโยชน์อย่างไร
ข้อมูลขนาดใหญ่สำคัญอย่างไรในยุคปัจจุบัน
- ปัจจุบันในปี 2020 มี Mobile Device มากกว่า 5000 พันล้าน ที่ใช้งานบนโลกใบนี้ และยังมีอปริมาณเพิ่มขึ้นในทุกๆ วัน
- เฉพาะ Facebook ก็มีคนใช้กว่า 2600 ล้านคน และ มีข้อมูลมากกว่า 500 TB ที่เกิดขึ้นในแต่ละวัน
- มีคนกด Like ใน Facebook มากกว่า 2.7 Billion ในแต่ละวัน
- ข้อมูลมีแนวโน้มเพิ่มมากขึ้น ๆ กว่า 10 เท่าในทุกๆ 5 ปี
- แนวโน้มของข้อมูลมีขนาดที่ใหญ่ขึ้น คือเป็นรูปภาพ และ วีดีโอมากขึ้น
- ข้อมูลมีการเก็บมากขึ้นอันเกิดจาก IoT (Internet Of Things
Big Data ถึงมีความสำคัญ?
ด้วยข้อมูลที่มหาศาลที่มี หากได้ข้อมูลลูกค้าและใช้ข้อมูลจากทุกแหล่งที่เป็นไปได้ เพื่อวิเคราะห์เพื่อให้ได้ผลลัพธ์ที่คุณต้องการ ซึ่งช่วยให้คุณสามารถเข้าใจผู้บริโภคได้มากขึ้น ลดต้นทุนได้ ลดเวลาระยะเวลาดำเนินการ และสามารถตัดสินใจได้อย่างแม่นยำมากขึ้น รู้พฤติกรรมเชิงลึกของลูกค้า สามารถนำไปวางแผนการตลาด ช่องทางการจัดจำหน่าย ที่เข้าถึงและช่วยให้ขยายฐานลูกค้าได้อย่างรวดเร็ว หรือนำข้อมูลไปพัฒนาสินค้าหรือบริการให้มีประสิทธิภาพยิ่งขึ้น และยังใช้วิเคราะห์แนวโน้มที่จะเกิดขึ้นในอนาคตได้ ยิ่งมีข้อมูลมากเท่าไร ความผิดพลาดหรือความเพี้ยนของข้อมูลก็น้อยลง
นอกจากนี้ยังช่วยให้คุณสามารถใช้ข้อมูลจากทุกแหล่งที่เป็นไปได้ และวิเคราะห์เพื่อให้ได้ผลลัพธ์ที่คุณต้องการ ซึ่งช่วยให้คุณสามารถเข้าใจผู้บริโภคได้มากขึ้น ลดต้นทุนได้ ลดเวลาระยะเวลาดำเนินการ และสามารถตัดสินใจได้อย่างแม่นยำมากขึ้น ปัจจุบันหลายบริษัทได้นำ Big Data มาประยุกต์ใช้ในส่วนของการขายและการตลาดของธุรกิจ
- สร้างโอกาสทางรายได้ใหม่ ๆ
- ทำการตลาดได้อย่างมีประสิทธิภาพมากขึ้น
- มีการบริการลูกค้าที่ดีขึ้น เข้าใจลูกค้ามากขึ้น
- เพิ่มประสิทธิภาพของปฏิบัติการณ์
- มีความได้เปรียบด้านการแข่งขันกับคู่แข่ง
Big Data ทำหน้าที่อยู่เบื้องหลังเทคโนโลยีมากมาย หนึ่งในเทคโนโลยีที่สำคัญในอนาคตเช่น IoT : Internet of Things หรือ อินเทอร์เน็ตในทุกสรรพสิ่ง เทคโนโลยีที่เชื่อมโยงข้อมูลกันเป็นเครือข่าย เราจึงสามารถสั่งงานหรือควบคุมระบบจากระยะไกลได้ ไม่ว่าจะเป็น Smart Device, Smart Home ไปจนถึง Smart City
ปัญหาการจัดการข้อมูลขนาดใหญ่ในไทย
- ไม่มีข้อมูล หรือข้อมูลน้อยเกินไป: ปัญหานี้เจอมาในหน่วยงานหลายแห่ง ที่มีข้อมูลน้อยมากระดับแสนเรคอร์ด และขาดข้อมูลที่เข้ามาอย่างต่อเนื่อง, ข้อมูลไม่อัพเดท , มีข้อมูลกระจัดกระจายแต่ยังไม่สามารถรวบรวมข้อมูลได้ , ปัญหาของการหวงข้อมูลของหน่วยงานต่างๆทั้งภายในและภายนอก
- ขาดบุคลากร: เรื่องของ Big Data มีแนวคิดที่แตกต่างจากการทำ Database หรือ Data warehouse แบบเดิมๆ จะต้องเรืยนรู้หลักการใหม่ๆเช่นการทำ DataLake หลักการของ ELT แทนที่ ETL
- ขาดเครื่องมือ: เมื่อพูดถึงการทำโปรเจ็ค Big Data ถ้าจะต้องลงมือทำจริงในองค์กรและมีข้อมูลขนาดใหญ่ อาจต้องติดตั้งที่ใช้งบประมาณนับสิบล้านบาท
- ไม่มีการนำมาใช้งานจริง: แม้ว่ามีการวิเคราะห์ข้อมูลออกมาแล้ว แต่คนในบ้านเราไม่ได้คุ้นเคยกับการใช้ข้อมูลมากนัก เราไม่ค่อยใช้ตัวเลขในการตัดสินใจ
Big Data ในประเทศจีน
ประเทศจีนถือว่ามีความก้าวหน้าทางเทคโนโลยีทางด้าน Big data มากที่สุดในโลก การเก็บข้อมูลจากประชาชนจีนอย่างมหาศาลและปริมาณมากมายในทุกวันโดยไม่ต้องกังวลด้านสิทธิส่วนบุคคลแบบโลกตะวันตก ยิ่งเป็นประโยชน์อย่างยิ่งในการพัฒนาเทคโนโลยีทั้ง AI และ Big data อย่างมาก การเก็บข้อมูลประชาชนของรัฐบาลจีน มีอยู่ในหลายๆมิติอาทิเช่น
- การติดตั้งกล้อง CCTV ที่สามารถใช้ระบบจดจำใบหน้า Facial recognition ตรวจสอบพฤติกรรมประชาชนทั่วประเทศจีนจำนวน 176 ล้านตัวและจะขยายเป็น 450 ล้านตัวในปี 2020 ทำให้นึกถึงระบบตรวจสอบคนทำผิดกฎหมายอาทิเช่นการไม่ข้ามทางม้าลายด้วยการทำ Realtime facial recognition จากกล้อง CCTV ที่อยู่ในที่สาธารณะทั่วเมือง
- การติดตามข้อมูลการซื้อสินค้าออนไลน์และการใช้จ่ายเงินผ่าน Mobile payment อย่าง Alipay หรือ WeChat ที่เอาทำ Social credit scoring อย่าง Zhima (Sesame) Credit ทำให้เขาสามารถติดตามพฤติกรรมของประชาชนได้ว่ามีพฤติกรรมการใช้จ่ายอย่างไร เดินทางไปไหน
- การบังคับให้รถยนต์ไฟฟ้าทุกยี่ห้อทั้งในและต่างประเทศตั้งแต่ Tesla, Volkswagen, BMW, Ford, General Motors, Nissan, BYD ต้องส่งข้อมูลตำแหน่งรถยนต์กลับมายังรัฐบาลตลอดเวลา
- การดึงข้อมูลจาก Mobile App ต่างๆเข้ามา และมีการบังคับให้คนบางกลุ่มเช่นชาวอุยกูร์ต้องติดตั้ง Mobile App ที่ชื่อ Jingwang เพื่อตรวจสอบรูปภาพ ไฟล์ หรือเอกสารต่างๆที่อยู่ในมือถือ
- รัฐบาลจีน กำลังทดลองระบบ Big Data เก็บข้อมูลประชากร มาใช้จัดอันดับหรือเครดิตประชากร เพื่อประโยชน์ในการคัดกรองคนเข้าสู่การกู้เงิน การศึกษา การประกันภัย การท่องเที่ยว เป็นต้น เป็นแผนการในชื่อว่า Social Credit System
Big Data กับ Thailand 4.0
Thailand 4.0 เป็นวิสัยทัศน์เชิงนโยบาย ที่เปลี่ยนเศรษฐกิจแบบเดิมไปสู่เศรษฐกิจที่ขับเคลื่อนด้วยนวัตกรรม เปลี่ยนจากการขับเคลื่อนประเทศด้วยภาคอุตสาหกรรมไปสู่การขับเคลื่อนด้วยเทคโนโลยี และความคิดสร้างสรรค์ ประชาชนส่วนใหญ่เข้าถึงระบบดิจิทัลมากขึ้น เพราะมีความเชื่อมโยงกับชีวิตประจำวัน ไม่ว่าจะเป็นการซื้อขาย การลงทุน การติดต่อสื่อสาร การใช้สินค้า Smart Device ต่างๆ เรียกว่าเริ่มต้นทุกวันด้วยข้อมูลทั้งสิ้น ทุกสิ่งทุกอย่างจึงถูกขับเคลื่อนอยู่บนฐานข้อมูล
ทำให้มีการใช้ประโยชน์จาก Big Data ที่แพร่หลายมากขึ้น สำหรับภาคธุรกิจแล้ว Big Data ที่รวบรวมได้จากพฤติกรรมและกิจกรรมที่เกิดขึ้นจริงกลายเป็นขุมทรัพย์ที่องค์กรธุรกิจสามารถนำไปวิเคราะห์เพื่อให้ได้ Insight ที่เป็นประโยชน์สำหรับการดำเนินงาน สร้างความเข้าใจความสัมพันธ์ในรูปแบบใหม่ๆ นำไปคาดการณ์พฤติกรรมผู้บริโภคในเชิงลึกได้มากกว่าการวิเคราะห์ข้อมูลแบบดั้งเดิมในอดีต