Data for Social Good

เป็นที่ทราบกันดีอยู่แล้วว่า ในปัจจุบันองค์กรต่าง ๆ มีการใช้ประโยชน์จาก “ข้อมูล” กันอย่างแพร่หลาย เพื่อช่วยเพิ่มรายได้และความสามารถในการแข่งขันขององค์กร แต่หลายคนอาจจะนึกไม่ถึงว่าข้อมูลนั้นสามารถนำมาสร้างประโยชน์ให้กับสังคมในวงกว้างได้เช่นกัน

“The best minds of my generation are thinking about how to make people click ads. That sucks.”

— Jeffrey Hammerbacher, Co-founder at Cloudera

จะดีหรือไม่…ถ้าเราสามารถนำข้อมูลไปใช้ทำนายว่าในเมืองของเราจะเกิดอาชญากรรมที่ไหน เมื่อไหร่ เหมือนกับที่ Facebook และ Google ทำนายได้ว่าเราจะคลิกโฆษณาอันไหน (Ad clicks)

จะดีหรือไม่…ถ้าเราสามารถนำข้อมูลไปใช้แนะนำว่าชาวไร่ชาวนาว่าควรปลูกอะไรในฤดูกาลนี้ เหมือนกับที่ Amazon และ Netflix แนะนำสินค้าและภาพยนตร์ให้เรา

ในบทความนี้ ผมเลยขออนุญาตมาเล่าถึงโปรเจคเก่า ๆ ที่ได้มีส่วนร่วม และมีการนำข้อมูล ไม่ว่าจะเป็นข้อมูลแบบเปิด (Open Data) ข้อมูลจากภาคเอกชน หรือข้อมูลที่เก็บกันเอง มาสร้างประโยชน์ให้กับสังคม หรือวิเคราะห์ให้เราเข้าใจสภาพเศรษฐกิจและสังคมมากขึ้น

1. ทำนายอาชญากรรมจากข้อมูลการโทร 911

จากข้อมูลการโทรแจ้งเหตุ 911 ใน San Francisco 👮🏻‍ ซึ่งระบุพิกัดจุดเกิดเหตุ ประเภทอาชญากรรม และเวลาเกิดเหตุ เราสามารถสร้างโมเดลเพื่อใช้ในการทำนายการเกิดอาชญากรรมประเภทต่าง ๆ ในเมือง และนำผลการทำนายจากโมเดลไปใช้ในการวางตำแหน่งรถลาดตระเวนของตำรวจ 🚔 เพื่อให้สามารถเดินทางไปยังจุดเกิดเหตุได้รวดเร็วที่สุด โดยในการวางแผน ผู้ใช้งานสามารถเลือกได้ว่าจะใช้รถลาดตระเวนกี่คัน และให้ความสำคัญกับอาชญากรรมประเภทไหนมากกว่ากัน

อันนี้เป็นโปรเจคที่ผมกับเพื่อนร่วมงานที่ Facebook ช่วยกันทำภายใน 24 ชม. ในงาน Bayes Impact Hackathon ผู้ที่สนใจสามารถอ่านรายละเอียดเชิงเทคนิคเพิ่มเติมได้ที่นี่

http://seanjtaylor.github.io/out-for-justice/

2. วิเคราะห์ประสิทธิภาพเครือข่ายระบบขนส่งสาธารณะในเมือง

จากข้อมูลตารางการเดินรถสาธารณะรอบ ๆ เมือง Boston 🚍🚆 เราสามารถนำมาสร้างเป็นกราฟ เพื่อใช้คำนวณหาเส้นทางการเดินทางที่ดีที่สุดจากจุดหนึ่งไปยังอีกจุดหนึ่ง ซึ่งสามารถนำมาต่อยอดใช้ในการระบุพื้นที่ที่บริการขนส่งสาธาณะยังไม่สะดวกหรือครอบคลุมเท่าที่ควร

Located at the center of the plot is the root of a transfer tree (an origin location). The circular slices in the innermost ring represent the access points, where commuters board their first transit services. Circular slices representing subsequent transfer points are placed outward from the center. The angle swept by each slice (hence, the area) is proportional to the number of destinations whose shortest paths visit the corresponding transit node. And the color of each slice indicates the travel time from the origin to the corresponding transit node. (Chiraphadhanakul, 2013)

นอกจากนี้เมื่อนำข้อมูลระบบขนส่งสาธาณะข้างต้น มาวิเคราะห์ร่วมกับข้อมูลการใช้งานระบบเช่าจักรยาน 🚲 (ซึ่งมีการเปิดเผยสู่สาธารณะผ่าน Hubway Data Challenge) ก็จะช่วยให้เราสามารถประเมินได้ว่าระบบเช่าจักรยานนี้มีส่วนช่วยให้การเดินทางโดยระบบขนส่งสาธารณะในเมืองดีขึ้นมากน้อยแค่ไหน ทั้งในเรื่องของการลดระยะเวลาการเดินทาง (รถไม่ติด 🚦และไม่ต้องรอรถนาน 🚏) และการเพิ่มทางเลือกในการเดินทางในพื้นที่ที่อาจจะยังเชื่อมต่อกับเครือข่ายขนส่งสาธารณะหลักไม่ทั่วถึง

ตัวอย่าง: การเดินทางจาก Charles Circle ไป B.U. Central ต้องใช้เวลาถึง 30 นาทีด้วยระบบขนส่งสาธารณะหลัก โดยต้องขึ้นรถไฟสายสีแดง แล้วเดินไปต่อรถเมล์สาย 47 แต่ด้วยระบบเช่าจักรยาน ผู้ใช้งานใช้เวลาเดินทางโดยเฉลี่ยเพียง 14 นาที ซึ่งประหยัดเวลาเดินทางได้มากถึง 16 นาที!
Interactive Visualization แสดงการเดินทางจากจุด ๆ หนึ่งในเมืองไปยังทุก ๆ สถานีขนส่งสาธารณะในเมือง

ลองเล่นกันได้ที่ลิงค์ด้านล่างนี้เลย (โหลดช้าเล็กน้อย ข้อมูลเยอะครับ)

http://hubway.virot.me/

3. Visual Analytics สำหรับข้อมูลผลผลิตทางการเกษตร

กระทรวงเกษตรของสหรัญอเมริกาได้มีการรวบรวมข้อมูลผลผลิตทางการเกษตรภายในประเทศย้อนหลังไปเกือบ 100 ปี แบ่งแยกตามประเภทของพืช 🌽🥔🥜และพื้นที่เพาะปลูกในระดับ County (ประเทศสหรัฐอเมริกามีทั้งหมด 3,007 Counties)

เพื่อช่วยให้เกษตรกร 👨‍🌾 หรือนักวิจัย 👩🏻‍🔬 สามารถเข้าถึงและวิเคราะห์ข้อมูลปริมาณมหาศาลเหล่านี้ได้ง่ายขึ้น เราได้สร้าง Interactive Data Visualization สำหรับวิเคราะห์และเปรียบเทียบผลผลิตทางการเกษตรตามช่วงเวลาหรือพื้นที่เพาะปลูกได้ง่าย ๆ ช่วยให้เกษตรกรวางแผนการเพาะปลูกของตัวเองได้ดียิ่งขึ้น (พืชไหนกำลังมา แนวโน้มคนในพื้นที่กำลังเปลี่ยนไปปลูกอะไร ฯลฯ)

Interactive Visualization: http://croptrends.virot.me/

ลองดูผลงานอื่น ๆ จาก USDA Innovation Challenge ที่มีการนำข้อมูลการเกษตรมาสร้างประโยชน์ได้ ที่นี่

ได้เห็นตัวอย่างการใช้ประโยชน์จาก Open Data กันไปหลายอันแล้ว ลองมาดูตัวอย่างการนำข้อมูลจากภาคเอกชนมาใช้ประโยชน์กันบ้าง

4. ศึกษารูปแบบการอพยพย้ายถิ่นฐานของประชากรโลก

ประชากรโลกมีการอพยพย้ายถิ่นฐานกันอยู่ตลอดเวลา การจะรวบรวมข้อมูลสัมมะโนครัวประชากรจากทุกประเทศอาจจะไม่ใช่เรื่องที่ง่ายนัก 🗄🗂 จากข้อมูล Hometown และ Current City บน Facebook Profile ของผู้ใช้งานนับพันล้านคน 👥 เราสามารถสร้างแผนที่แสดงการย้ายถิ่นฐานในทุกพื้นที่ทั่วทุกมุมโลก 🗺 โดยในผลงานชิ้นนี้ เราให้ความสนใจกับการย้ายถิ่นฐานของกลุ่มคนขนาดใหญ่ (Coordinated Migration) จากเมืองหนึ่งไปอีกเมืองหนึ่ง ซึ่งอาจจะเป็นผลมาจากสงคราม ภัยพิบัติ หรือเหตุผลทางเศรษฐกิจ

กรุงเทพมหานครเป็นหนึ่งในเมืองที่คนอพยพถิ่นฐานเข้ามาทำงานมากที่สุดเมืองหนึ่ง ทั้งจากในและต่างประเทศ

ตามไปอ่านบทความเต็ม ๆ กันได้เลย

ผลงานนี้ได้รับการพูดถึงในหนังสือ Dataclysm โดย Christian Rudder (Co-founder @ OkCupid) และ UN Global Pulse ซึ่งเป็นหน่วยงานภายใต้ UN ที่ส่งเสริมการใช้ประโยชน์จาก Big Data ในการพัฒนาสังคม

5. ปรับเส้นทางการเดินรถเมล์ให้ตรงกับความต้องการใช้งาน

ระบบขนส่งสาธารณะที่มีการนำ Contactless Smart Card มาใช้ในการชำระค่าโดยสาร 💳 ช่วยให้เราสามารถนำข้อมูลมาวิเคราะห์ได้ว่าป้ายไหน สถานีไหน 🚏 มีคนขึ้น มีคนลงมากน้อยแค่ไหน ปัญหาที่มักพบบ่อยปัญหาหนึ่งในระบบขนส่งสาธารณะ ก็คือรถเต็ม! 😱 ทำให้ไม่สามารถรับผู้โดยสารเพิ่มเติมได้และเสียเวลาจอดแช่ที่สถานีค่อนข้างนานเนื่องจากการขึ้นลงรถเป็นไปด้วยความยากลำบาก

โดยในโปรเจคนี้ เราได้นำข้อมูลการขึ้นลงรถเมล์ของเมือง ๆ หนึ่ง (แน่นอนว่าไม่ใช่ในประเทศไทย เพราะเรายังมีพี่ ๆ กระเป๋ารถเมล์ให้บริการเราอยู่ 😆) มาใช้ในการปรับเส้นทางการเดินรถเมล์ เพื่อเพิ่มประสิทธิภาพการให้บริการ จากเดิมที่ทุกคันวิ่งหวานเย็นจอดทุกป้าย รับคนเพิ่มได้บ้าง รับไม่ได้บ้าง ใครที่ขึ้นไม่ได้ก็รอกันต่อไป เราก็บริหารจัดการกันใหม่ โดยให้บางคันเป็นรถด่วน (Express service) ที่จอดแค่บางป้ายเท่านั้น ซึ่งมีประโยชน์อย่างยิ่งในเส้นทางการเดินรถที่มีผู้โดยสารจำนวนมากขึ้นตั้งแต่ป้ายแรก ๆ แล้วนั่งยาวไปลงป้ายหลัง ๆ

Chiraphadhanakul, 2013

หลาย ๆ ครั้งที่เราอยากแก้ไขปัญหาบางอย่างด้วยข้อมูล แต่ข้อมูลนั้นไม่เคยมีใครเก็บรวบรวมมาก่อน หรือข้อมูลที่มีการรวบรวมไว้ไม่ได้ถูกเปิดเผยออกมาในรูปแบบที่สามารถนำไปพัฒนาต่อยอดได้ง่าย เราก็อาจจะต้องสร้างเครื่องมือในการเก็บข้อมูลด้วยตัวเอง #จะทำดีอย่ารีรอ

6. รวบรวมข้อมูลปัญหาในเมือง

ยุพิน หรือชื่ออังกฤษว่า YouPin เป็น application ให้คุณมาปัก pin รายงานปัญหาต่าง ๆ ในเมือง เช่น ทางเท้ามีน้ำท่วมขัง หรือขยะล้นส่งกลิ่น เพื่อรวบรวมข้อมูลและประสานงานส่งต่อไปยังหน่วยงานที่รับผิดชอบ

https://youpin.city/app

โดยพัฒนาออกมาเป็น บอทป้ายุพิน คุณป้าใจดี(รึเปล่า?)ที่คอยรับฟังปัญหาของคนเมืองผ่าน Facebook Messenger App เพื่อช่วยให้คนสามารถรายงานปัญหาผ่านมือถือได้ง่าย เห็นปัญหาปุ๊ป สามารถหยิบมือถือขึ้นมาแล้วรายงานได้ทันที โดยไม่ต้องดาวน์โหลดแอปเพิ่ม

คุยกับป้ายุพินได้ผ่าน Facebook Messenger (m.me/youpin.city)

นอกจากการส่งข้อมูลต่อไปยังหน่วยงานที่เกี่ยวข้องเพื่อดำเนินการแล้ว เราสามารถนำข้อมูลเหล่านี้มาวิเคราะห์ปัญหาต่าง ๆ ในกรุงเทพ อาทิเช่น เขตไหนมีปัญหาอะไรเยอะ คนรายงานปัญหาเรื่องขยะเยอะในช่วงเวลาไหน ควรจัดการเดินรถเก็บขยะอย่างไร พื้นที่ไหนมีน้ำขังบ่อยครั้ง ทางเท้าตรงไหนที่ต้องซ่อมแล้วซ่อมอีก และใครเป็นผู้รับเหมาก่อสร้างทางเท้านั้น ฯลฯ เพื่อนำไปปรับปรุงการให้บริการและอำนวยความสะดวกให้กับประชาชนได้อย่างทั่วถึง

ใครที่ยังไม่รู้จักป้ายุพิน อ่านรายละเอียดเพิ่มเติมได้จากบล็อกก่อนหน้านี้ได้เลย

https://medium.com/skooldio/lessons-learned-youpin-chatbot-88c66b8ec443

7. ช่วยน้อง ม. ปลาย เตรียมสอบเข้ามหาวิทยาลัย

กำลังเป็นที่วิพากษ์วิจารณ์กับระบบคัดเลือกบุคคลเข้าศึกษาระดับอุดมศึกษาระบบใหม่ ที่มีชื่อย่อสั้น ๆ ว่า TCAS ทั้งในเรื่องของรูปแบบการคัดเลือก และ ระบบซอฟต์แวร์ที่มีปัญหา

ระบบ TCAS ทำให้การเตรียมตัวสอบเข้ามหาวิทยาลัยของน้อง ม. 6 ปีนี้เปลี่ยนไปจากเดิมค่อนข้างมาก ด้วยรูปแบบการยื่นคะแนนที่แบ่งเป็น 5 รอบ และกฎเกณฑ์ในแต่ละรอบที่แตกต่างกันไปตามเกณฑ์การรับสมัครของแต่ละมหาวิทยาลัยและสาขาที่นักเรียนสนใจ

ปัญหาสำคัญอย่างหนึ่งของระบบในปีนี้คือ ข้อมูลเกณฑ์การรับสมัครที่ไม่ได้มีการรวบรวมไว้ให้อยู่ในรูปแบบที่ใช้งานได้ง่าย บางมหาลัยก็มาเป็น Excel บ้างก็มาเป็น PDF บ้างก็มีการอัพเดทรายละเอียดระหว่างทางโดยที่น้อง ๆ ไม่รู้ตัว ด้วยข้อมูลการเปิดรับกว่า 80 มหาวิทยาลัย และกว่า 4,000 สาขาวิชา ทำให้การเข้าถึงข้อมูลนั้นมีความซับซ้อนและเป็นไปด้วยความยากลำบาก

ตัวอย่างข้อมูล เฉพาะของมหาวิทยาลัยเกษตรศาสตร์

หากคุณเป็นนักเรียน ม.6 ที่อยากเข้าคณะสถาปัตย์ คุณอาจจะต้องเข้าเว็บไซต์ของจุฬาฯ เพื่อได้ข้อมูลแบบหนึ่ง เข้าเว็บธรรมศาสตร์หรือศิลปากรเพื่อให้ได้ชุดข้อมูลอีกแบบหนึ่ง แล้วมาเปรียบเทียบกัน ถ้าสมมติมีตัวเลือกอยู่ในใจ 5 คณะ ก็ต้องทำวนไปเรื่อย ๆ 😱 ซึ่งตรงจุดนี้ทำให้น้อง ๆ เสียเวลาไปกับการค้นหาข้อมูล แทนที่จะเอาเวลาไปเตรียมตัวสอบ

เราอยากจะช่วยน้อง ๆ ค้นหาคณะในดวงใจ และวางแผนการเตรียมตัวสอบได้ง่ายขึ้น แต่ทั้งหมดนี้จะไม่สามารถทำได้เลย หากไม่มีข้อมูล

ในโลกอุดมคติ เราอยากได้ API (Application Programming Language) ที่ใช้ในการขอข้อมูลจากฐานข้อมูลส่วนกลางว่าตกลงคณะนี้มีเงื่อนไขกฎเกณฑ์การรับสมัครเป็นอย่างไร ใช้คะแนนวิชาไหนเท่าไหร่ ต้องยื่นเอกสารอะไรบ้าง รับกี่คน แต่ในโลกแห่งความเป็นจริง เราต้องทั้งเขียน script ในการแปลงข้อมูลจากไฟล์หลากหลายรูปแบบ รวมทั้งสร้างเครื่องมือสำหรับให้คนมาช่วยกรอกข้อมูลเข้าระบบของเรา เพื่อที่จะได้นำข้อมูลทั้งหมดมาต่อยอดสร้างเป็นแอปให้น้อง ๆ ม. 6 เตรียมตัวสอบได้ง่ายขึ้น

TCASter App (https://itunes.apple.com/th/app/tcaster/id1267234768)

เมื่อได้ข้อมูลทั้งหมดมาแล้ว หลังจากที่น้อง ๆ เลือกคณะในดวงใจภายในแอป ❤️ เราก็สามารถ Personalize ประสบการณ์การใช้งานให้กับน้อง ๆ ได้ราวกับ Facebook News Feed น้องที่อยากเข้าคณะวิศวะ ก็ไม่จำเป็นที่จะต้องเห็นข่าวสารเกี่ยวกับการรับสมัครของคณะแพทย์ หรือในการเตรียมตัวสอบ ก็จะเห็นแค่รายละเอียดของวิชาที่จำเป็นต้องใช้ในการสอบเข้าคณะวิศวกรรมศาสตร์เท่านั้น

อยากรู้จักกับแอป TCASter มากขึ้น ลองอ่าน Design Case Study กันดูเลย!

https://medium.com/skooldio/tcaster-design-case-study-188ae08dbf4a

สุดท้ายนี้ สำหรับใครที่อยากลุกขึ้นมาทำดีด้วยข้อมูล แต่ยังไม่รู้จะเริ่มยังไงลองดูตัวอย่างไอเดียการนำ Big Data มาใช้เพื่อการพัฒนาสังคมอย่างยั่งยืนจาก UN กันดู

http://www.un.org/en/sections/issues-depth/big-data-sustainable-development/index.html