เป็นที่ทราบกันดีอยู่แล้วว่า ในปัจจุบันองค์กรต่าง ๆ มีการใช้ประโยชน์จาก “ข้อมูล” กันอย่างแพร่หลาย เพื่อช่วยเพิ่มรายได้และความสามารถในการแข่งขันขององค์กร แต่หลายคนอาจจะนึกไม่ถึงว่าข้อมูลนั้นสามารถนำมาสร้างประโยชน์ให้กับสังคมในวงกว้างได้เช่นกัน
“The best minds of my generation are thinking about how to make people click ads. That sucks.”
— Jeffrey Hammerbacher, Co-founder at Cloudera
จะดีหรือไม่…ถ้าเราสามารถนำข้อมูลไปใช้ทำนายว่าในเมืองของเราจะเกิดอาชญากรรมที่ไหน เมื่อไหร่ เหมือนกับที่ Facebook และ Google ทำนายได้ว่าเราจะคลิกโฆษณาอันไหน (Ad clicks)
จะดีหรือไม่…ถ้าเราสามารถนำข้อมูลไปใช้แนะนำว่าชาวไร่ชาวนาว่าควรปลูกอะไรในฤดูกาลนี้ เหมือนกับที่ Amazon และ Netflix แนะนำสินค้าและภาพยนตร์ให้เรา
ในบทความนี้ ผมเลยขออนุญาตมาเล่าถึงโปรเจคเก่า ๆ ที่ได้มีส่วนร่วม และมีการนำข้อมูล ไม่ว่าจะเป็นข้อมูลแบบเปิด (Open Data) ข้อมูลจากภาคเอกชน หรือข้อมูลที่เก็บกันเอง มาสร้างประโยชน์ให้กับสังคม หรือวิเคราะห์ให้เราเข้าใจสภาพเศรษฐกิจและสังคมมากขึ้น
1. ทำนายอาชญากรรมจากข้อมูลการโทร 911
จากข้อมูลการโทรแจ้งเหตุ 911 ใน San Francisco 👮🏻 ซึ่งระบุพิกัดจุดเกิดเหตุ ประเภทอาชญากรรม และเวลาเกิดเหตุ เราสามารถสร้างโมเดลเพื่อใช้ในการทำนายการเกิดอาชญากรรมประเภทต่าง ๆ ในเมือง และนำผลการทำนายจากโมเดลไปใช้ในการวางตำแหน่งรถลาดตระเวนของตำรวจ 🚔 เพื่อให้สามารถเดินทางไปยังจุดเกิดเหตุได้รวดเร็วที่สุด โดยในการวางแผน ผู้ใช้งานสามารถเลือกได้ว่าจะใช้รถลาดตระเวนกี่คัน และให้ความสำคัญกับอาชญากรรมประเภทไหนมากกว่ากัน
Team @Facebook in the house cleaning up the streets & predicting crime in SF w/ Project “Out for Justice” #bayeshack pic.twitter.com/JKqEN5lPBc
— Bayes Impact (@bayesimpact) November 15, 2014
อันนี้เป็นโปรเจคที่ผมกับเพื่อนร่วมงานที่ Facebook ช่วยกันทำภายใน 24 ชม. ในงาน Bayes Impact Hackathon ผู้ที่สนใจสามารถอ่านรายละเอียดเชิงเทคนิคเพิ่มเติมได้ที่นี่
http://seanjtaylor.github.io/out-for-justice/
2. วิเคราะห์ประสิทธิภาพเครือข่ายระบบขนส่งสาธารณะในเมือง
จากข้อมูลตารางการเดินรถสาธารณะรอบ ๆ เมือง Boston 🚍🚆 เราสามารถนำมาสร้างเป็นกราฟ เพื่อใช้คำนวณหาเส้นทางการเดินทางที่ดีที่สุดจากจุดหนึ่งไปยังอีกจุดหนึ่ง ซึ่งสามารถนำมาต่อยอดใช้ในการระบุพื้นที่ที่บริการขนส่งสาธาณะยังไม่สะดวกหรือครอบคลุมเท่าที่ควร
นอกจากนี้เมื่อนำข้อมูลระบบขนส่งสาธาณะข้างต้น มาวิเคราะห์ร่วมกับข้อมูลการใช้งานระบบเช่าจักรยาน 🚲 (ซึ่งมีการเปิดเผยสู่สาธารณะผ่าน Hubway Data Challenge) ก็จะช่วยให้เราสามารถประเมินได้ว่าระบบเช่าจักรยานนี้มีส่วนช่วยให้การเดินทางโดยระบบขนส่งสาธารณะในเมืองดีขึ้นมากน้อยแค่ไหน ทั้งในเรื่องของการลดระยะเวลาการเดินทาง (รถไม่ติด 🚦และไม่ต้องรอรถนาน 🚏) และการเพิ่มทางเลือกในการเดินทางในพื้นที่ที่อาจจะยังเชื่อมต่อกับเครือข่ายขนส่งสาธารณะหลักไม่ทั่วถึง
ลองเล่นกันได้ที่ลิงค์ด้านล่างนี้เลย (โหลดช้าเล็กน้อย ข้อมูลเยอะครับ)
3. Visual Analytics สำหรับข้อมูลผลผลิตทางการเกษตร
กระทรวงเกษตรของสหรัญอเมริกาได้มีการรวบรวมข้อมูลผลผลิตทางการเกษตรภายในประเทศย้อนหลังไปเกือบ 100 ปี แบ่งแยกตามประเภทของพืช 🌽🥔🥜และพื้นที่เพาะปลูกในระดับ County (ประเทศสหรัฐอเมริกามีทั้งหมด 3,007 Counties)
เพื่อช่วยให้เกษตรกร 👨🌾 หรือนักวิจัย 👩🏻🔬 สามารถเข้าถึงและวิเคราะห์ข้อมูลปริมาณมหาศาลเหล่านี้ได้ง่ายขึ้น เราได้สร้าง Interactive Data Visualization สำหรับวิเคราะห์และเปรียบเทียบผลผลิตทางการเกษตรตามช่วงเวลาหรือพื้นที่เพาะปลูกได้ง่าย ๆ ช่วยให้เกษตรกรวางแผนการเพาะปลูกของตัวเองได้ดียิ่งขึ้น (พืชไหนกำลังมา แนวโน้มคนในพื้นที่กำลังเปลี่ยนไปปลูกอะไร ฯลฯ)
ลองดูผลงานอื่น ๆ จาก USDA Innovation Challenge ที่มีการนำข้อมูลการเกษตรมาสร้างประโยชน์ได้ ที่นี่
ได้เห็นตัวอย่างการใช้ประโยชน์จาก Open Data กันไปหลายอันแล้ว ลองมาดูตัวอย่างการนำข้อมูลจากภาคเอกชนมาใช้ประโยชน์กันบ้าง
4. ศึกษารูปแบบการอพยพย้ายถิ่นฐานของประชากรโลก
ประชากรโลกมีการอพยพย้ายถิ่นฐานกันอยู่ตลอดเวลา การจะรวบรวมข้อมูลสัมมะโนครัวประชากรจากทุกประเทศอาจจะไม่ใช่เรื่องที่ง่ายนัก 🗄🗂 จากข้อมูล Hometown และ Current City บน Facebook Profile ของผู้ใช้งานนับพันล้านคน 👥 เราสามารถสร้างแผนที่แสดงการย้ายถิ่นฐานในทุกพื้นที่ทั่วทุกมุมโลก 🗺 โดยในผลงานชิ้นนี้ เราให้ความสนใจกับการย้ายถิ่นฐานของกลุ่มคนขนาดใหญ่ (Coordinated Migration) จากเมืองหนึ่งไปอีกเมืองหนึ่ง ซึ่งอาจจะเป็นผลมาจากสงคราม ภัยพิบัติ หรือเหตุผลทางเศรษฐกิจ
ตามไปอ่านบทความเต็ม ๆ กันได้เลย
ผลงานนี้ได้รับการพูดถึงในหนังสือ Dataclysm โดย Christian Rudder (Co-founder @ OkCupid) และ UN Global Pulse ซึ่งเป็นหน่วยงานภายใต้ UN ที่ส่งเสริมการใช้ประโยชน์จาก Big Data ในการพัฒนาสังคม
5. ปรับเส้นทางการเดินรถเมล์ให้ตรงกับความต้องการใช้งาน
ระบบขนส่งสาธารณะที่มีการนำ Contactless Smart Card มาใช้ในการชำระค่าโดยสาร 💳 ช่วยให้เราสามารถนำข้อมูลมาวิเคราะห์ได้ว่าป้ายไหน สถานีไหน 🚏 มีคนขึ้น มีคนลงมากน้อยแค่ไหน ปัญหาที่มักพบบ่อยปัญหาหนึ่งในระบบขนส่งสาธารณะ ก็คือรถเต็ม! 😱 ทำให้ไม่สามารถรับผู้โดยสารเพิ่มเติมได้และเสียเวลาจอดแช่ที่สถานีค่อนข้างนานเนื่องจากการขึ้นลงรถเป็นไปด้วยความยากลำบาก
โดยในโปรเจคนี้ เราได้นำข้อมูลการขึ้นลงรถเมล์ของเมือง ๆ หนึ่ง (แน่นอนว่าไม่ใช่ในประเทศไทย เพราะเรายังมีพี่ ๆ กระเป๋ารถเมล์ให้บริการเราอยู่ 😆) มาใช้ในการปรับเส้นทางการเดินรถเมล์ เพื่อเพิ่มประสิทธิภาพการให้บริการ จากเดิมที่ทุกคันวิ่งหวานเย็นจอดทุกป้าย รับคนเพิ่มได้บ้าง รับไม่ได้บ้าง ใครที่ขึ้นไม่ได้ก็รอกันต่อไป เราก็บริหารจัดการกันใหม่ โดยให้บางคันเป็นรถด่วน (Express service) ที่จอดแค่บางป้ายเท่านั้น ซึ่งมีประโยชน์อย่างยิ่งในเส้นทางการเดินรถที่มีผู้โดยสารจำนวนมากขึ้นตั้งแต่ป้ายแรก ๆ แล้วนั่งยาวไปลงป้ายหลัง ๆ
หลาย ๆ ครั้งที่เราอยากแก้ไขปัญหาบางอย่างด้วยข้อมูล แต่ข้อมูลนั้นไม่เคยมีใครเก็บรวบรวมมาก่อน หรือข้อมูลที่มีการรวบรวมไว้ไม่ได้ถูกเปิดเผยออกมาในรูปแบบที่สามารถนำไปพัฒนาต่อยอดได้ง่าย เราก็อาจจะต้องสร้างเครื่องมือในการเก็บข้อมูลด้วยตัวเอง #จะทำดีอย่ารีรอ
6. รวบรวมข้อมูลปัญหาในเมือง
ยุพิน หรือชื่ออังกฤษว่า YouPin เป็น application ให้คุณมาปัก pin รายงานปัญหาต่าง ๆ ในเมือง เช่น ทางเท้ามีน้ำท่วมขัง หรือขยะล้นส่งกลิ่น เพื่อรวบรวมข้อมูลและประสานงานส่งต่อไปยังหน่วยงานที่รับผิดชอบ
โดยพัฒนาออกมาเป็น บอทป้ายุพิน คุณป้าใจดี(รึเปล่า?)ที่คอยรับฟังปัญหาของคนเมืองผ่าน Facebook Messenger App เพื่อช่วยให้คนสามารถรายงานปัญหาผ่านมือถือได้ง่าย เห็นปัญหาปุ๊ป สามารถหยิบมือถือขึ้นมาแล้วรายงานได้ทันที โดยไม่ต้องดาวน์โหลดแอปเพิ่ม
นอกจากการส่งข้อมูลต่อไปยังหน่วยงานที่เกี่ยวข้องเพื่อดำเนินการแล้ว เราสามารถนำข้อมูลเหล่านี้มาวิเคราะห์ปัญหาต่าง ๆ ในกรุงเทพ อาทิเช่น เขตไหนมีปัญหาอะไรเยอะ คนรายงานปัญหาเรื่องขยะเยอะในช่วงเวลาไหน ควรจัดการเดินรถเก็บขยะอย่างไร พื้นที่ไหนมีน้ำขังบ่อยครั้ง ทางเท้าตรงไหนที่ต้องซ่อมแล้วซ่อมอีก และใครเป็นผู้รับเหมาก่อสร้างทางเท้านั้น ฯลฯ เพื่อนำไปปรับปรุงการให้บริการและอำนวยความสะดวกให้กับประชาชนได้อย่างทั่วถึง
ใครที่ยังไม่รู้จักป้ายุพิน อ่านรายละเอียดเพิ่มเติมได้จากบล็อกก่อนหน้านี้ได้เลย
https://medium.com/skooldio/lessons-learned-youpin-chatbot-88c66b8ec443
7. ช่วยน้อง ม. ปลาย เตรียมสอบเข้ามหาวิทยาลัย
กำลังเป็นที่วิพากษ์วิจารณ์กับระบบคัดเลือกบุคคลเข้าศึกษาระดับอุดมศึกษาระบบใหม่ ที่มีชื่อย่อสั้น ๆ ว่า TCAS ทั้งในเรื่องของรูปแบบการคัดเลือก และ ระบบซอฟต์แวร์ที่มีปัญหา
ระบบ TCAS ทำให้การเตรียมตัวสอบเข้ามหาวิทยาลัยของน้อง ม. 6 ปีนี้เปลี่ยนไปจากเดิมค่อนข้างมาก ด้วยรูปแบบการยื่นคะแนนที่แบ่งเป็น 5 รอบ และกฎเกณฑ์ในแต่ละรอบที่แตกต่างกันไปตามเกณฑ์การรับสมัครของแต่ละมหาวิทยาลัยและสาขาที่นักเรียนสนใจ
ปัญหาสำคัญอย่างหนึ่งของระบบในปีนี้คือ ข้อมูลเกณฑ์การรับสมัครที่ไม่ได้มีการรวบรวมไว้ให้อยู่ในรูปแบบที่ใช้งานได้ง่าย บางมหาลัยก็มาเป็น Excel บ้างก็มาเป็น PDF บ้างก็มีการอัพเดทรายละเอียดระหว่างทางโดยที่น้อง ๆ ไม่รู้ตัว ด้วยข้อมูลการเปิดรับกว่า 80 มหาวิทยาลัย และกว่า 4,000 สาขาวิชา ทำให้การเข้าถึงข้อมูลนั้นมีความซับซ้อนและเป็นไปด้วยความยากลำบาก
หากคุณเป็นนักเรียน ม.6 ที่อยากเข้าคณะสถาปัตย์ คุณอาจจะต้องเข้าเว็บไซต์ของจุฬาฯ เพื่อได้ข้อมูลแบบหนึ่ง เข้าเว็บธรรมศาสตร์หรือศิลปากรเพื่อให้ได้ชุดข้อมูลอีกแบบหนึ่ง แล้วมาเปรียบเทียบกัน ถ้าสมมติมีตัวเลือกอยู่ในใจ 5 คณะ ก็ต้องทำวนไปเรื่อย ๆ 😱 ซึ่งตรงจุดนี้ทำให้น้อง ๆ เสียเวลาไปกับการค้นหาข้อมูล แทนที่จะเอาเวลาไปเตรียมตัวสอบ
เราอยากจะช่วยน้อง ๆ ค้นหาคณะในดวงใจ และวางแผนการเตรียมตัวสอบได้ง่ายขึ้น แต่ทั้งหมดนี้จะไม่สามารถทำได้เลย หากไม่มีข้อมูล
ในโลกอุดมคติ เราอยากได้ API (Application Programming Language) ที่ใช้ในการขอข้อมูลจากฐานข้อมูลส่วนกลางว่าตกลงคณะนี้มีเงื่อนไขกฎเกณฑ์การรับสมัครเป็นอย่างไร ใช้คะแนนวิชาไหนเท่าไหร่ ต้องยื่นเอกสารอะไรบ้าง รับกี่คน แต่ในโลกแห่งความเป็นจริง เราต้องทั้งเขียน script ในการแปลงข้อมูลจากไฟล์หลากหลายรูปแบบ รวมทั้งสร้างเครื่องมือสำหรับให้คนมาช่วยกรอกข้อมูลเข้าระบบของเรา เพื่อที่จะได้นำข้อมูลทั้งหมดมาต่อยอดสร้างเป็นแอปให้น้อง ๆ ม. 6 เตรียมตัวสอบได้ง่ายขึ้น