ข้อมูลองค์ความรู้โดย
Web Master (IT)
ตำแหน่ง อาจารย์

มุมมองสี่มิติของข้อมูลขนาดใหญ่

ประเภททางด้าน IT หลัก :   Data Management & Analysis
ประเภททางด้าน IT ย่อย :   Business Intelligence
  ลงข้อมูลเมื่อ 17:01:32 07/01/2013
  Page View (1441) แบ่งปัน

 ในปี 2544 นายดั๊ก เลน นักวิเคราะห์จากบริษัท เมตา กรุ๊ป (ปัจจุบันคือบริษัท การ์ทเนอร์ จำกัด) ได้นิยามคำว่า มุมมองสามมิติของการจัดการข้อมูลว่า หมายถึง ปริมาณ (volume) ความหลากหลาย (variety) และความเร็ว (velocity) โดยในปัจจุบัน บริษัทการ์ทเนอร์ ยังคงเดินหน้าใช้โมเดลนี้ช่วยองค์กรต่างๆ ให้เกิดความเข้าใจในข้อมูลขนาดใหญ่และค้นหารูปแบบต่างๆ ที่มีอยู่ภายในข้อมูลเหล่านั้น เพื่อนำไปสู่การตัดสินใจที่ดียิ่งขึ้น โดยล่าสุดรายงานจากบริษัท ไอดีซี ได้เพิ่ม “มูลค่า” (value) ให้เป็นมิติข้อมูลที่สี่ นอกเหนือจาก ปริมาณ ความรวดเร็ว และความหลากหลาย

                 การดึง “มูลค่าเชิงกลยุทธ์” ออกมาจากข้อมูลที่กำลังเพิ่มจำนวนขึ้นอย่างรวดเร็ว ซึ่งมีความหลากหลาย และมีขนาดมหาศาลนั้น สามารถสร้างประโยชน์อย่างมากให้แก่องค์กรหรือแม้แต่สังคมโดยรวมได้ ตัวอย่างความสำเร็จมีให้เห็นแล้วอย่างมากมาย โดยกรณีตัวอย่างที่มีชื่อเสียงที่สุด เช่น ผู้ประกอบการด้านข้อมูลขนาดใหญ่ อย่าง Amazon และ Google ที่ให้ความสำคัญอย่างมากต่อข้อมูลการคลิก (click streams) ที่เชื่อมโยงกับตำแหน่งการจัดวางโฆษณา สำหรับตัวอย่างอื่นๆ ได้แก่ Walmart และ 7-Eleven ที่ใช้ข้อมูลเพื่อช่วยในการจัดเตรียมสต็อกสินค้าและการส่งเสริมการขาย จึงเป็นเหตุผลสำคัญที่องค์กรธุรกิจและผู้นำด้านไอทีทั้งหมดจะต้องเข้าใจในสี่มิติของข้อมูลขนาดใหญ่ รวมทั้งจะต้องเรียนรู้ด้วยว่า กลยุทธ์ระบบจัดเก็บข้อมูลที่เหมาะสมสามารถสร้างรากฐานที่มั่นคงสำหรับการขยายตัวทางธุรกิจในอนาคตได้อย่างไร

                ในบริบทของข้อมูลขนาดใหญ่นั้น "ปริมาณ" หมายถึงจำนวนข้อมูลที่ถูกสร้างขึ้น ปริมาณอาจมีความแตกต่างกันระหว่างภาคอุตสาหกรรมและภาคส่วนบุคคล ตัวอย่างเช่น ผู้ให้บริการระบบคลาวด์ โดยปกติจะสามารถจัดการกับข้อมูลได้มากถึงระดับเอ็กซาไบต์ (1 ล้านล้านเทราไบต์) ขณะที่ร้านค้าปลีกจะจัดการข้อมูลในแต่ละรายการที่มีการเปลี่ยนแปลง (Transaction) ที่ระดับเพตาไบต์ (1,024 เทราไบต์) อย่างไรก็ตาม ไม่ว่าขนาดของข้อมูลจะมากน้อยเพียงใด องค์กรธุรกิจทั้งสองรูปแบบนี้ต้องพบกับความท้าทายของปริมาณข้อมูลขนาดใหญ่ที่กำลังเพิ่มจำนวนขึ้นอย่างต่อเนื่อง อันเป็นผลมาจากวิวัฒนาการของเทคโนโลยีและแนวทางปฏิบัติใหม่ๆ ทางธุรกิจ
 แนวทางแก้ไขปัญหาปริมาณข้อมูลขนาดใหญ่นั้น คือความสามารถในการปรับขยายของระบบจัดเก็บข้อมูลที่ครอบคลุมหลายมิติ โดยสามารถปรับขยายในแนวตั้ง (scale up) เพื่อเพิ่มประสิทธิภาพในการเข้าถึงเฉพาะบุคคล ปรับขยายในแนวนอน (scale out) เพื่อการเข้าถึงแบบกระจาย และปรับขยายในแนวลึก (scale deep) เพื่อการเข้าถึงทรัพยากรระบบจัดเก็บข้อมูลแบบเสมือนที่ต่างชนิดกันได้อย่างครอบคลุม ซึ่งจากข้อมูลของบริษัท การ์ทเนอร์ พบว่าปริมาณข้อมูลทั่วโลกจะขยายตัวอย่างน้อย 59% ต่อปี

                มิติที่สี่ - มูลค่าของข้อมูลขนาดใหญ่

                "มูลค่า" ของข้อมูลขนาดใหญ่มาในรูปแบบของสารสนเทศที่ได้จากการวิเคราะห์ข้อมูล จะเห็นได้ว่ามีตัวอย่างมากมายที่แสดงให้เห็นว่า ข้อมูลขนาดใหญ่สามารถนำมาซึ่งมูลค่าแก่บริษัทขนาดใหญ่และเล็กได้ด้วยการรวบรวมข้อมูลจากแหล่งที่มาใหม่ๆ และเชื่อมโยงเข้าด้วยกันเพื่อสร้างเป็นสารสนเทศที่จะช่วยให้ธุรกิจสามารถขยายตัว และเพิ่มขีดความสามารถด้านการแข่งขันได้ในระดับสูงสุด ในช่วงต้นของเอกสารนี้ เราได้ยกตัวอย่าง Amazon, Google, Walmart และ 7-Eleven ซึ่งทั้งหมดนี้ได้พิสูจน์ให้เห็นแล้วว่าพวกเขาสามารถค้นพบมูลค่าในข้อมูล ขนาดใหญ่ได้อย่างเห็นผลการทำเหมืองข้อมูล (Data Mining) และการวิเคราะห์ข้อมูลที่มีการเปลี่ยนแปลงแต่ละรายการ (Transaction) โดยใช้การคัดแยก การถ่ายโอน และการโหลด (Extract/Transform/Load), NoSQL, Hadoop และฐานข้อมูล ในหน่วยความจำหลัก (in-memory) ถือเป็นโซลูชั่นที่ดีเยี่ยมสำหรับข้อมูลขนาดใหญ่ที่ถูกสร้างโดยองค์กรธุรกิจและมนุษย์ อย่างไรก็ตาม โซลูชั่นเหล่านี้อาจไม่สามารถตอบสนองความต้องการด้านมูลค่าข้อมูลขนาดใหญ่ได้ ในอนาคต ซึ่งเป็นเรื่องที่เกี่ยวข้องกับข้อมูลที่สร้างขึ้นจากเครื่องเป็นหลัก

                ฮิตาชิ ดาต้า ซิสเต็มส์ เชื่อว่า "มูลค่า" ของข้อมูลขนาดใหญ่ในอนาคตจะต้องใช้แนวทางใหม่ๆ ในการบริหารจัดการ เนื่องจากชนิดของข้อมูลมีความซับซ้อนมากขึ้นเรื่อยๆ เช่น การสแกนสมองหรือ MRI ปัจจุบันมีบุคลากรและระบบที่มีความสามารถในการเขียนและวิเคราะห์ข้อมูลนี้อยู่แล้ว แต่ก็จำเป็นต้องใช้ความรู้และความสามารถที่ไม่เคยมีมาก่อน เพื่อเปรียบเทียบชุดข้อมูลที่ซับซ้อนเหล่านี้กับสิ่งที่มีอยู่ในอดีต ซึ่งอาจมีอายุยาวนานกว่า 10 ปีหรือมากกว่านั้น และจากแนวโน้มข้อมูลปัจจุบันและความต้องการของผู้ใช้ที่เปลี่ยนไปได้ยืนยันให้เห็นแล้วว่า โมเดลและสถาปัตยกรรมที่มีอยู่นั้น ไม่เพียงพอที่จะดึงมุมมองเชิงลึกจากข้อมูล ขนาดใหญ่ โดยเฉพาะข้อมูลที่เครื่องสร้างขึ้น

                ดังนั้นฮิตาชิจึงได้คิดค้นโซลูชั่น "คลาวด์ สามชั้นสำหรับข้อมูล 4 มิติ" ที่ประกอบด้วยส่วนประกอบหลักสามส่วน ได้แก่ ระบบคลาวด์สำหรับโครงสร้างพื้นฐาน ระบบคลาวด์สำหรับเนื้อหา และระบบคลาวด์สำหรับสารสนเทศ โดยทั้งหมดนี้ยึดตามแนวทางของ ฮิตาชิ ดาต้า ซิสเต็มส์ เกี่ยวกับโซลูชั่นระบบจัดเก็บข้อมูลเพื่อจัดการค่าพารามิเตอร์ในสี่มิติ ได้แก่ ปริมาณ ความเร็ว ความหลากหลาย และมูลค่า

                เพื่อรองรับการใช้งานข้อมูลขนาดใหญ่ที่มีความหลากหลายและมีมิติต่างๆ ได้อย่างครอบคลุมและเป็นประโยชน์

                ความต้องการ "มูลค่า" ของข้อมูลขนาดใหญ่ในอนาคต มีความเฉพาะเจาะจงสูงมาก ซึ่งจำเป็นต้องอาศัยขีดความสามารถที่ครอบคลุมของกลุ่มบริษัทฮิตาชิ ในมุมนี้จะเห็นได้ว่า ฮิตาชิ มีความแข็งแกร่งแตกต่างจากบริษัทอื่นอย่างชัดเจน ด้วยจำนวนบริษัทสาขา 900 แห่ง ที่มีความชำนาญและมีความเชี่ยวชาญเชิงลึกในด้านข้อมูลอย่างรอบด้าน ตัวอย่างเช่น ฝ่ายการแพทย์ของ ฮิตาชิ จะสร้าง MRI ที่ไม่เพียงแต่ถ่ายภาพสแกนเท่านั้น แต่จะทำการวิเคราะห์ภาพถ่ายดังกล่าวด้วย

                ในฝ่ายระบบขนส่ง ฮิตาชิ ได้พัฒนาโซลูชั่นที่ครอบคลุม ตั้งแต่รถไฟความเร็วสูง (หัวกระสุน) ในญี่ปุ่นไปจนถึงระบบรถไฟไฮบริดสำหรับมหกรรมกีฬาโอลิมปิก ณ กรุงลอนดอน ขณะที่อีกฝ่ายหนึ่งของ ฮิตาชิ ได้สร้างกล้องชนิดพิเศษที่มีซอฟต์แวร์จดจำใบหน้าสำหรับตรวจจับและติดตามตัวบุคคล และยังใช้สำหรับวิเคราะห์การแสดงออกทางสีหน้าของบุคคลที่ตอบสนองต่อสิ่งเร้า เช่น โฆษณา ในปัจจุบันยังไม่มีบริษัทอื่นใดในโลกที่มีความเชี่ยวชาญรอบด้านเช่นนี้ ซึ่งรวมถึงด้านพลังงาน การขนส่ง การแพทย์ และการเงินด้วย ขีดความสามารถดังกล่าวล้วนแต่มีเทคโนโลยีสารสนเทศเป็นแกนหลัก และจากการแบ่งปันมุมมองร่วมกันทั้งกลุ่มบริษัทของ ฮิตาชิ นี่เอง ที่ช่วยสนับสนุนให้ ฮิตาชิ ดาต้า ซิสเต็มส์ ก้าวสู่การเป็นบริษัทที่มีความโดดเด่นอย่างมากในด้านการแก้ไขปัญหาข้อมูลขนาดใหญ่ในอนาคต




ที่มา: คมชัดลึกออนไลน์



องค์ความรู้ที่มีผู้อ่านมากสุด
รายละเอียดของระบบ e-Purchasing Online ของกรมส่งเสริมอุตสาหกรรม กระทรวงอุตสาหกรรม
รายละเอียดของระบบ e-Purchasing Online ของกรมส่งเสริมอุตสาหกรรม กระทรวงอุตสาหกรรม

โดย... Web Master (IT)

เรียนรู้เรื่อง เมนบอร์ด (Mainboard, mother board)
แผงวงจรหลัก เป็นหัวใจสำคัญที่สุดที่อยู่ภายในเครื่อง เมื่อเปิดฝาเครื่องออกมาจะเป็นแผงวงจรขนาดใหญ่วางนอนอยู่ นั่นคือส่วนที่เรียกว่า "เมนบอร์ด"

โดย... Web Master (IT)

AutoCAD คืออะไร
AutoCAD (Computer Aided Drefting/Dedign, CAD) เป็นซอฟต์แวร์ช่วยออกแบบด้วยคอมพิวเตอร์ ที่สามารถรองรับการทำงานทั้งใน 2 มิติ และ 3 มิติ

โดย... Web Master (IT)

ทำความรู้จักกับ IIG (International Internet Gateway ) & NIX(National Internet Exchange )
การใช้งานอินเตอร์เน็ตของเราทุกคน จำเป็นต้องผ่านระบบการให้ บริการของ IIG และ NIX เพราะว่า เป็นเหมือนเส้นทางหลักของศูนย์กลางโครงข่าย ของประเทศไทย ทั้งภายในและ ภายนอกประเทศ ที่จากเดิมเราจะทราบกันอยู่แล้วว่า บริการทั้งสองประเภทนี้จะมีผู้ให้บริการ แบบผูกขาดอยู่เพียงรายเดียวเท่านั้น คือ การสื่อสารแห่งประเทศไทย เพียงเท่านั้น แต่ ณ ปัจจุบันนี้ได้มีหน่วยงานที่เข้ามา กำกับดูแลในเรื่องของโทรคมนาคมของเมืองไทยอย่างเป็น รูปธรรมมากยิ่งขึ้น จึงก่อให้เกิดการแข่งขันอย่างเสรี และปัจจุบัน ทาง กทช. ผู้เป็นหน่วยงานหลัก ของ การกำกับดูแลได้เปิดอนุญาตให้กลุ่มบริษัทเอกชนทั่วไป สามารถขอรับใบอนุญาต การให้ บริการทั้งสองประเภทได้ เพื่อให้เกิดการแข่งขันกันอย่างเป็นธรรม และก่อให้ เกิดประโยชน์สูงสุด แก่ผู้บริโภคกันเลยละครับ

โดย... Web Master (IT)

ความรู้เรื่อง...การ์ดจอ
การ์ดจอ (Video Card) การ์ดแสดงผล หรือ กราฟฟิกการ์ด (Graphic card) เป็น แผงวงจรอิเล็กทรอนิกส์ ที่ทำหน้าที่ในการนำข้อมูลที่ได้จากการประมวลผลของซีพียูมาแสดงบนจอภาพ ทำให้ผู้ใช้ สามารถควบคุมการทำงาน ได้อย่างมีประสิทธิภาพ โดยจอภาพจะเป็นส่วนที่รับข้อมูลจากการ์ดแสดงผลอีกทีหนึ่ง การ์ดกราฟฟิกทีได้รับความนิยมและใช้กันแพร่หลายในอยู่ปัจจุบัน เป็นการ์ดกราฟฟิกที่มี GPU เป็นตัวประมวลผล

โดย... Web Master (IT)

Windows XP Service Pack 3 Overview
ภาพรวม Windows XP Service Pack 3 จะประกอบด้วย security updates hotfix และ patch ต่างๆ ที่ไมโครซอฟท์ปล่อยหลังออก SP2 เป็นต้นมาไม่มีการเปลี่ยนแปลงในเชิงฟังก์ชั่นและการทำงานที่สำคัญ แต่จะอัพเดตองค์ประกอบต่างๆ อย่าง Microsoft Management Console (MMC) 3.0 และ Microsoft Core XML Services 6.0 (MSXML6) เป็นเวอร์ชั่นปัจจุบัน สิ่งที่น่าสนใจประการหนึ่งคือ ไมโครซอฟท์ไม่ได้รวมเอา Windows Internet Explorer 7 เข้ามาไว้ใน SP3 แต่จะใส่มาเฉพาะส่วนที่เป็นอัพเดตและ fix เท่านั้น คล้ายกับว่าไมโครซอฟท์ตั้งใจจะไม่บีบให้ลูกค้าต้องเปลี่ยนจาก IE6 มาใช้ IE7 ใครที่ต้องการอยู่กับ IE6 (ด้วยเหตุผลใดก็ตาม) ก็จะยังสามารถใช้ IE6 ได้ สำหรับใครที่เปลี่ยนไปเป็น IE7 แล้วจะมีอัพเดตมาให้เช่นเดียวกัน

โดย... Web Master (IT)

การประยุกต์ใช้ DATA WAREHOUSEING
มีการประมาณการณ์เอาไว้ว่า ถ้าไม่มีการนำเอาระบบ Data Warehouse มาประยุกต์ใช้ในองค์กร จะมีคน เพียง 10 เปอร์เซ็นต์เท่านั้นที่จะสามารถใช้งานระบบสารสนเทศได้ตามความต้องการ และนั่นก็คือจำนวนคนที่มีระดับความรู้ ทาง IT เพียงพอที่จะสร้าง Query ขึ้นด้วยตนเองเพื่อสนองความต้องการด้านข้อมูลของตน นอกจากนั้นแล้ว ระบบ EIS (Executive Information System) และ DSS (Decision Support System) ก็มักจะทำงานได้ไม่ตรงกับที่ต้องการ เพราะข้อมูล ดิบจากฐานข้อมูลประจำวันนั้น เข้าถึงยาก หรือไม่ก็ทำความเข้าใจได้ไม่ง่ายนัก ยิ่งไปกว่านั้น การอนุญาตให้ผู้ใช้ระดับสูง สามารถเข้าถึงและค้นหาฐานข้อมูลได้โดยตรงอาจจะส่งผลต่อประสิทธิภาพของงานข้อมูล รวมไปถึงความเป็นระเบียบ (Data Integrity) ของฐานข้อมูลด้วย

โดย... Web Master (IT)

นวัตกรรมรถบรรทุกขนาดใหญ่ B-double รถกึ่งพ่วงบรรทุกแบบพิเศษ
ในยุคที่ประสิทธิภาพและต้นทุนการขนส่งเป็นเรื่องสำคัญที่ต้องพัฒนาร่วมกันอย่างเร่งด่วน โดยเฉพาะเมื่อต้นทุนหลักของการขนส่งคือน้ำมันเชื้อเพลิงมีสัดส่วนสูงขึ้นอย่างต่อเนื่อง ก๊าซธรรมชาติและไบโอดีเซลกลายเป็นประเด็นสำคัญที่ผู้ประกอบการขนส่งต้องศึกษาและพัฒนากองรถมาทดลองและใช้กันแน่นอน การพัฒนารถไฟและการขนส่งทางลำน้ำให้สามารถขนส่งสินค้าในเส้นทางหลักได้มากขึ้น มีบริการที่แน่นอนและสามารถเชื่อมต่อกับการขนส่งด้วยรถบรรทุกได้สะดวกรวดเร็ว เป็นเรื่องที่ทุกฝ่ายปรารถนา เพราะคาดหมายว่าจะทำให้การขนส่งได้ประสิทธิภาพที่ดีกว่าด้วยต้นทุนที่ต่ำกว่าการขนส่งด้วยรถบรรทุก ประเด็นเรื่องการขนส่งในปริมาณมากๆ ต่อเที่ยว มักจะยกประเด็นในเรื่องการประหยัดพลังงาน การลดปริมาณมลพิษจากน้ำมัน และการประหยัดค่าจ้างแรงงานของพนักงานขับรถ โดยทั้งหมดคิดหารเฉลี่ยจากจำนวนหน่วยสินค้าและระยะทางขนส่งต่อเที่ยวนั้นๆ หลายครั้งที่รถบรรทุกถูกวางตำแหน่งให้ทำหน้าที่ขนส่งและกระจายสินค้าในระยะทางรัศมีสั้นๆ รอบๆ สถานีหรือต้นทางปลายทางที่เป็น hub

โดย... Web Master (IT)

เรียนรู้เรื่อง CPU
CPU (Central Processing Unit) หรือ โปรเซสเซอร์ (Processor) คือ ส่วนหนึ่งของเครื่องคอมพิวเตอร์ที่มีหน้าที่ควบคุมกา รทำงานของส่วนอื่นๆ โดยทั่วไปแล้ว ซีพียูจะประกอบไปด้วย หน่วยควบคุม (Control Unit), หน่วยประมวลผลคณิตศาสตร์และตรรกศาสตร์ (Arithmetic and Logic Unit; ALU) และหน่วยความจำ ได้แก่ รีจีสเตอร์ (Register), แคช (Cache), แรม (RAM) และรอม (ROM)

โดย... Web Master (IT)

การเขียนโปรแกรมเชิงวัตถุ (Object Oriented Programming: OOP)
ในปัจจุบันภาษาในการเขียนโปรแกรมเพื่อพัฒนาระบบสารสนเทศที่ใช้ในองค์กรธุรกิจ มีมากมายหลายภาษาให้เลือก การเรียนรู้ภาษาเขียนโปรแกรมหรือการมีความรู้ในหลาย ๆ ภาษาถือเป็นสิ่งที่ดี แต่ไม่ได้หมายความว่าเราจำเป็นต้องเขียนโปรแกรมให้ได้ทุก ๆ ภาษา แต่สามารถเลือกบางภาษาที่เรามีความถนัดหรือเลือกที่จะเริ่มต้นกับภาษาใด ภาษาหนึ่งได้ ซึ่งการเขียนโปรแกรมเชิงวัตถุถือได้ว่าได้รับความนิยมในปัจจุบันรวมถึงแนวโน้มในอนาคต ซึ่ง Java ก็เป็นหนึ่งในการเขียนโปรแกรมเชิงวัตถุ ที่มีพื้นฐานมาจากภาษา C และคิดว่าน่าจะเป็นอีกภาษาหนึ่งที่น่าศึกษาและน่าเรียนรู้ เพราะเทคโนโลยีของ Java ถือว่ากำลังร้อนแรงในแวดวงของ Software

โดย... Web Master (IT)