Big Data คืออะไร สำคัญอย่างไร

5654

ถ้าจะพูดถึง Trend ที่กำลังมามาแรงและเป็นที่พูดถึงในแวดวงไอทีหรือธุรกิจ ต้องเคยได้ยิน Big Data ผ่านหูกันมาบ้างแล้ว บางทีก็สงสัยไหมครับว่า Big Data คืออะไร? ทำไมต้อง Big Data? แล้ว สำคัญอย่างไร?

ในยุคปัจจุบันที่โลกถูกขับเคลื่อนด้วยข้อมูล ยิ่งข้อมูลยิ่งมาก ข้อมูลขนาดใหญ่ บิ๊ก ดาต้า (Big Data) การตัดสินใจต่างๆ ยิ่งถูกต้องและแม่นยำมากยิ่งขึ้น กระบวนการคิดของคนทั่วไปหรือแม้แต่องค์กรต่างๆในทุกวันนี้ส่วนใหญ่อยู่บนฐานของการรวบรวมข้อมูล ประมวลผล เพื่อประกอบการตัดสินใจทำอะไรบางอย่าง

Big Data คืออะไร สำคัญอย่างไร

Data คืออะไร

ข้อมูลหรือ Data คือ ค่าของตัวแปรในเชิงคุณภาพหรือเชิงปริมาณ ข้อเท็จจริง ข้อความหรือเรื่องราวที่เกี่ยวข้องกับสิ่งต่าง ๆ โดยอยู่ในรูปแบบที่เหมาะสมต่อการแปลความหมายและการประมวลผลซึ่งข้อมูลอาจจะได้มาจากการสังเกต การเก็บรวบรวม การวัด ข้อมูลเป็นได้ทั้งข้อมูลตัวเลขหรือสัญลักษณ์ใด ๆ ซึ่งถ้าเป็นข้อมูลที่ใช้ในระบบคอมพิวเตอร์ที่สามารถนำไปประมวลผลได้แบ่งได้เป็น

  • ข้อมูลตัวเลข (Numeric Data)
  • ข้อมูลตัวอักษร (Text Data)
  • ข้อมูลเสียง (Audio Data)
  • ข้อมูลภาพ (Images Data)
  • ข้อมูลภาพเคลื่อนไหว (Video Data) 

Big Data คืออะไร

Big Data คือปริมาณข้อมูล(Data)จำนวนมหาศาล ที่เกิดขึ้นแต่ละวัน เช่น ข้อมูลจากการทำธุรกิจ ข้อมูลจากการซื้อขายสินค้า ข้อมูลคนผ่านเข้าออกสถานีรถไฟ หรือ ข้อมูลคนที่ใช้บริการของ facebook ข้อมูลที่มีปริมาณมหาศาลจนซอฟต์แวร์หรือฮาร์ดแวร์ธรรมดานั้นไม่สามารถที่จะจัดการหรือวิเคราะห์ได้อย่างมีประสิทธิภาพ ดังนั้นต้องมีเทคโนโลยีและสถาปัตยกรรมไอทีรุ่นใหม่ ซึ่งอาจมาในรูปแบบซอฟต์แวร์ ที่สามารถรองรับการจัดเก็บ การจัดการ กรองเลือกข้อมูล การวิเคราะห์ แสดงผล และการใช้งานข้อมูลที่มีคุณลักษณะดังต่อไปนี้

คุณลักษณะของ Big Data

Big Data หมายถึงข้อมูลที่มีขนาดใหญ่ เร็ว หรือซับซ้อนจนยากหรือเป็นไปไม่ได้ที่จะประมวลผลโดยใช้วิธีการแบบเดิม ช่วงต้นปีค.ศ. 2000 เมื่อดั๊ก ลานีย์ นักวิเคราะห์อุตสาหกรรมได้ให้คำจำกัดความที่เป็นที่เข้าใจกันในขณะนี้ว่า ข้อมูลขนาดใหญ่ประกอบด้วย

  1. ปริมาณมาก (Volume) ซึ่งได้จากการที่องค์กรต่างๆ รวบรวมข้อมูลจากหลากหลายแหล่ง ซึ่งรวมถึงธุรกรรมของธุรกิจ อุปกรณ์อัจฉริยะ (IoT) อุปกรณ์อุตสาหกรรม วิดีโอ โซเชียลมีเดีย  ซึ่งสามารถเป็นได้ทั้งรูปแบบ Online และ Offline ซึ่งส่วนมากแล้วจะมีปริมาณมากกว่าหน่วย TB (Terabyte) ขึ้นไป
  2. มีการเปลี่ยนแปลงอย่างรวดเร็ว (Velocity) ด้วยเทคโนโลยีที่ล้ำหน้าขึ้นทุกวัน ความเร็วในการได้รับข้อมูลที่เพิ่มขึ้นและต้องได้รับการจัดการในเวลาที่เหมาะสม ข้อมูลเหล่านี้ในแบบเรียลไทม์ ส่งผ่านข้อมูลกันอย่างต่อเนื่อง (Real-time) จนทำให้การวิเคราะห์ง่ายๆ เกินขีดข้อจำกัด หรือไม่สามารถจับรูปแบบหรือทิศทางของข้อมูลได้
  3. หลากหลายประเภทหรือแหล่งที่มา (Variety) หมายถึงรูปแบบของข้อมูลที่แตกต่างกันออกไป นับตั้งแต่ข้อมูลที่มีโครงสร้าง ตัวเลขในฐานข้อมูลแบบดั้งเดิม ไปจนถึงเอกสารข้อความ ทั้งในรูปแบบ ตัวอักษร วิดีโอ รูปภาพ ไฟล์ต่างๆ และหลากหลายแหล่งที่มาเช่น Social Network ต่างๆ อีเมล วิดีโอ เสียง ข้อมูลหุ้น และธุรกรรมทางการเงิน
  4. ยังไม่ผ่านการประมวลผล (Veracity) ข้อมูลที่มีระดับคุณภาพปะปนกันไป ยังไม่ผ่านการ Process ให้อยู่ในรูปแบบของข้อมูลที่สามารถใช้สร้างประโยชน์ต่อองค์กร ซึ่งเป็นข้อมูลที่ยังไม่สมบูรณ์จึงยังไม่สามารถนำไปประกอบการตัดสินใจได้

การวิเคราะห์ข้อมูลขนาดใหญ่

การวิเคราะห์ข้อมูล Big data อาศัยหลักการพื้นฐานบางอย่างเพื่อพัฒนาเป็นเทคนิคในการดึงข้อมูลสำคัญออกจากชุดฐานข้อมูลขนาดใหญ่ที่เต็มไปด้วยข้อมูลหลากหลายรูปแบบ เพื่อนำมาหา pattern ของข้อมูลที่มองไม่เห็นด้วยตาเปล่า หารูปแบบความสัมพันธ์ที่ซ่อนอยู่ หาแนวโน้มการตลาด เทรนด์ความชอบของลูกค้า และข้อมูลอื่นๆที่เป็นประโยชน์ทางธุรกิจ

Big data analytics ต้องการเทคโนโลยีชั้นสูงคือ

AI (Artificial Intelligence) ปัญญาประดิษฐ์ ที่มีการวิเคราะห์เชิงลึก คล้ายความฉลาดของมนุษย์ การทำงานที่เปรียบเสมือนมันสมองที่แทรกอยู่ในเทคโนโลยีและนวัตกรรมต่างๆ ที่นำไปสู่การเพิ่มมูลค่าทางธุรกิจ และตอบโจทย์ความต้องการของผู้บริโภคในอุตสาหกรรมต่างๆ เร็วกว่า และแม่นยำ เกิดจากการประมวลผลจากข้อความรับเข้า แล้วแปลงเป็นการวิเคราะห์ข้อมูลที่ต้องการ
Machine Learning คือการสอนอัลกอริทึมให้เรียนรู้ทำความเข้าใจและตัดสินใจได้ด้วยตัวเองจาก ข้อมูลที่ป้อนให้
Deep Learning วิธีประมวลผลแบบขนาน (parallel processing) เพื่อทำให้มันสามารถเข้าใจและเรียนรู้จากข้อมูลจำนวนมากที่ได้รับอย่างต่อเนื่อง

ซึ่งเทคโนโลยีนำมาประมวลผลข้อมูลเพื่อวิเคราะห์ข้อมูลแล้วนำไปใช้ประโยชน์จากข้อมูลจำนวนมหาศาลที่เข้ามา

Big data มีประโยชน์อย่างไร

Big data มีประโยชน์อย่างไร

ข้อมูลขนาดใหญ่สำคัญอย่างไรในยุคปัจจุบัน

  • ปัจจุบันในปี 2020 มี Mobile Device มากกว่า 5000 พันล้าน ที่ใช้งานบนโลกใบนี้ และยังมีอปริมาณเพิ่มขึ้นในทุกๆ วัน
  • เฉพาะ Facebook ก็มีคนใช้กว่า 2600 ล้านคน และ มีข้อมูลมากกว่า 500 TB ที่เกิดขึ้นในแต่ละวัน
  • มีคนกด Like ใน Facebook มากกว่า 2.7 Billion ในแต่ละวัน
  • ข้อมูลมีแนวโน้มเพิ่มมากขึ้น ๆ กว่า 10 เท่าในทุกๆ 5 ปี
  • แนวโน้มของข้อมูลมีขนาดที่ใหญ่ขึ้น คือเป็นรูปภาพ และ วีดีโอมากขึ้น
  • ข้อมูลมีการเก็บมากขึ้นอันเกิดจาก IoT (Internet Of Things

Big Data ถึงมีความสำคัญ?

ด้วยข้อมูลที่มหาศาลที่มี หากได้ข้อมูลลูกค้าและใช้ข้อมูลจากทุกแหล่งที่เป็นไปได้ เพื่อวิเคราะห์เพื่อให้ได้ผลลัพธ์ที่คุณต้องการ ซึ่งช่วยให้คุณสามารถเข้าใจผู้บริโภคได้มากขึ้น ลดต้นทุนได้ ลดเวลาระยะเวลาดำเนินการ และสามารถตัดสินใจได้อย่างแม่นยำมากขึ้น รู้พฤติกรรมเชิงลึกของลูกค้า สามารถนำไปวางแผนการตลาด ช่องทางการจัดจำหน่าย ที่เข้าถึงและช่วยให้ขยายฐานลูกค้าได้อย่างรวดเร็ว หรือนำข้อมูลไปพัฒนาสินค้าหรือบริการให้มีประสิทธิภาพยิ่งขึ้น และยังใช้วิเคราะห์แนวโน้มที่จะเกิดขึ้นในอนาคตได้ ยิ่งมีข้อมูลมากเท่าไร ความผิดพลาดหรือความเพี้ยนของข้อมูลก็น้อยลง

นอกจากนี้ยังช่วยให้คุณสามารถใช้ข้อมูลจากทุกแหล่งที่เป็นไปได้ และวิเคราะห์เพื่อให้ได้ผลลัพธ์ที่คุณต้องการ ซึ่งช่วยให้คุณสามารถเข้าใจผู้บริโภคได้มากขึ้น ลดต้นทุนได้ ลดเวลาระยะเวลาดำเนินการ และสามารถตัดสินใจได้อย่างแม่นยำมากขึ้น ปัจจุบันหลายบริษัทได้นำ Big Data มาประยุกต์ใช้ในส่วนของการขายและการตลาดของธุรกิจ

  • สร้างโอกาสทางรายได้ใหม่ ๆ
  • ทำการตลาดได้อย่างมีประสิทธิภาพมากขึ้น
  • มีการบริการลูกค้าที่ดีขึ้น เข้าใจลูกค้ามากขึ้น
  • เพิ่มประสิทธิภาพของปฏิบัติการณ์
  • มีความได้เปรียบด้านการแข่งขันกับคู่แข่ง

Big Data ทำหน้าที่อยู่เบื้องหลังเทคโนโลยีมากมาย หนึ่งในเทคโนโลยีที่สำคัญในอนาคตเช่น IoT : Internet of Things หรือ อินเทอร์เน็ตในทุกสรรพสิ่ง เทคโนโลยีที่เชื่อมโยงข้อมูลกันเป็นเครือข่าย เราจึงสามารถสั่งงานหรือควบคุมระบบจากระยะไกลได้ ไม่ว่าจะเป็น Smart Device, Smart Home ไปจนถึง Smart City

ปัญหาการจัดการข้อมูลขนาดใหญ่ในไทย

  • ไม่มีข้อมูล หรือข้อมูลน้อยเกินไป: ปัญหานี้เจอมาในหน่วยงานหลายแห่ง ที่มีข้อมูลน้อยมากระดับแสนเรคอร์ด และขาดข้อมูลที่เข้ามาอย่างต่อเนื่อง, ข้อมูลไม่อัพเดท , มีข้อมูลกระจัดกระจายแต่ยังไม่สามารถรวบรวมข้อมูลได้ , ปัญหาของการหวงข้อมูลของหน่วยงานต่างๆทั้งภายในและภายนอก
  • ขาดบุคลากร: เรื่องของ Big Data มีแนวคิดที่แตกต่างจากการทำ Database หรือ Data warehouse  แบบเดิมๆ จะต้องเรืยนรู้หลักการใหม่ๆเช่นการทำ DataLake  หลักการของ ELT  แทนที่ ETL
  • ขาดเครื่องมือ: เมื่อพูดถึงการทำโปรเจ็ค Big Data ถ้าจะต้องลงมือทำจริงในองค์กรและมีข้อมูลขนาดใหญ่ อาจต้องติดตั้งที่ใช้งบประมาณนับสิบล้านบาท
  • ไม่มีการนำมาใช้งานจริง: แม้ว่ามีการวิเคราะห์ข้อมูลออกมาแล้ว แต่คนในบ้านเราไม่ได้คุ้นเคยกับการใช้ข้อมูลมากนัก เราไม่ค่อยใช้ตัวเลขในการตัดสินใจ

Big Data ในประเทศจีน

Big Data ในประเทศจีน

ประเทศจีนถือว่ามีความก้าวหน้าทางเทคโนโลยีทางด้าน Big data มากที่สุดในโลก การเก็บข้อมูลจากประชาชนจีนอย่างมหาศาลและปริมาณมากมายในทุกวันโดยไม่ต้องกังวลด้านสิทธิส่วนบุคคลแบบโลกตะวันตก ยิ่งเป็นประโยชน์อย่างยิ่งในการพัฒนาเทคโนโลยีทั้ง AI และ Big data อย่างมาก การเก็บข้อมูลประชาชนของรัฐบาลจีน มีอยู่ในหลายๆมิติอาทิเช่น

  • การติดตั้งกล้อง CCTV ที่สามารถใช้ระบบจดจำใบหน้า Facial recognition ตรวจสอบพฤติกรรมประชาชนทั่วประเทศจีนจำนวน 176 ล้านตัวและจะขยายเป็น 450 ล้านตัวในปี 2020 ทำให้นึกถึงระบบตรวจสอบคนทำผิดกฎหมายอาทิเช่นการไม่ข้ามทางม้าลายด้วยการทำ Realtime facial recognition จากกล้อง CCTV ที่อยู่ในที่สาธารณะทั่วเมือง
  • การติดตามข้อมูลการซื้อสินค้าออนไลน์และการใช้จ่ายเงินผ่าน Mobile payment อย่าง Alipay หรือ WeChat ที่เอาทำ Social credit scoring อย่าง Zhima (Sesame) Credit ทำให้เขาสามารถติดตามพฤติกรรมของประชาชนได้ว่ามีพฤติกรรมการใช้จ่ายอย่างไร เดินทางไปไหน
  • การบังคับให้รถยนต์ไฟฟ้าทุกยี่ห้อทั้งในและต่างประเทศตั้งแต่ Tesla, Volkswagen, BMW, Ford, General Motors, Nissan, BYD ต้องส่งข้อมูลตำแหน่งรถยนต์กลับมายังรัฐบาลตลอดเวลา
  • การดึงข้อมูลจาก Mobile App ต่างๆเข้ามา และมีการบังคับให้คนบางกลุ่มเช่นชาวอุยกูร์ต้องติดตั้ง Mobile App ที่ชื่อ Jingwang เพื่อตรวจสอบรูปภาพ ไฟล์ หรือเอกสารต่างๆที่อยู่ในมือถือ
  • รัฐบาลจีน กำลังทดลองระบบ Big Data เก็บข้อมูลประชากร มาใช้จัดอันดับหรือเครดิตประชากร เพื่อประโยชน์ในการคัดกรองคนเข้าสู่การกู้เงิน การศึกษา การประกันภัย การท่องเที่ยว เป็นต้น เป็นแผนการในชื่อว่า Social Credit System
Big Data และ Cloud Computing เพื่อเก็บข้อมูลของประเทศจีน

Big Data กับ Thailand 4.0

Thailand 4.0 เป็นวิสัยทัศน์เชิงนโยบาย ที่เปลี่ยนเศรษฐกิจแบบเดิมไปสู่เศรษฐกิจที่ขับเคลื่อนด้วยนวัตกรรม เปลี่ยนจากการขับเคลื่อนประเทศด้วยภาคอุตสาหกรรมไปสู่การขับเคลื่อนด้วยเทคโนโลยี และความคิดสร้างสรรค์ ประชาชนส่วนใหญ่เข้าถึงระบบดิจิทัลมากขึ้น เพราะมีความเชื่อมโยงกับชีวิตประจำวัน ไม่ว่าจะเป็นการซื้อขาย การลงทุน การติดต่อสื่อสาร การใช้สินค้า Smart Device ต่างๆ เรียกว่าเริ่มต้นทุกวันด้วยข้อมูลทั้งสิ้น ทุกสิ่งทุกอย่างจึงถูกขับเคลื่อนอยู่บนฐานข้อมูล 

ทำให้มีการใช้ประโยชน์จาก Big Data ที่แพร่หลายมากขึ้น สำหรับภาคธุรกิจแล้ว Big Data ที่รวบรวมได้จากพฤติกรรมและกิจกรรมที่เกิดขึ้นจริงกลายเป็นขุมทรัพย์ที่องค์กรธุรกิจสามารถนำไปวิเคราะห์เพื่อให้ได้ Insight ที่เป็นประโยชน์สำหรับการดำเนินงาน สร้างความเข้าใจความสัมพันธ์ในรูปแบบใหม่ๆ นำไปคาดการณ์พฤติกรรมผู้บริโภคในเชิงลึกได้มากกว่าการวิเคราะห์ข้อมูลแบบดั้งเดิมในอดีต