รู้จัก pandas - Library อันดับ 1 สำหรับการทำ Data Analysis | Skooldio Blog
Data

รู้จัก pandas – Library อันดับ 1 สำหรับการทำ Data Analysis

เคยได้ยินคนพูดถึงบ่อยๆ แต่ไม่รู้ว่า pandas คืออะไร?

เราไม่อยากให้ความไม่รู้ของคุณทำให้คุณพลาดโอกาสดีๆ ที่จะได้รู้จักกับ Library อันดับ 1 สำหรับการทำ Data Analysis ในบทความนี้ เราจะมาทำความรู้จัก Pandas กัน
รู้จัก pandas - Library อันดับ 1 สำหรับการทำ Data Analysis | Skooldio Blog

pandas คืออะไร?

pandas คือ หนึ่งใน Library สำคัญของภาษา Python เริ่มพัฒนาโดย Wes McKinney นักพัฒนาซอฟต์แวร์ชาวอเมริกัน ปัจจุบัน pandas เป็น open source ให้ทุกคนสามารถใช้ได้แบบฟรีๆ!

Wes McKinney ยังเป็นผู้เขียนหนังสือ Python for Data Analysis ที่เปรียบเสมือนคัมภีร์สุดยอดของ Python อีกด้วย
รู้จัก pandas - Library อันดับ 1 สำหรับการทำ Data Analysis | Skooldio Blog
pandas มาจากคำว่า Panel Data (ชุดข้อมูลหลายมิติ) มีจุดเด่นด้านการวิเคราะห์ข้อมูล (Data Analysis) และการทำความสะอาด (Data Cleaning) ซึ่งเป็น Process ที่สำคัญมากในการทำงานกับข้อมูล

ใครควรรู้จัก pandas?

pandas ถือเป็นสิ่งที่ขาดไม่ได้สำหรับคนที่อยากเป็น Data Scientist โดยที่ pandas จะเริ่มมีบทบาทสำคัญตั้งแต่การนำเข้าข้อมูลเลยทีเดียว ในการทำงานจริง Data Scientist มักจะต้องทำงานร่วมกับทีมอื่นๆ ซึ่งแต่ละทีมอาจจะมีวิธีการเก็บข้อมูลแตกต่างกัน การนำเข้าข้อมูลจึงอาจกินเวลานานได้ หากไม่มีตัวช่วยอย่าง pandas

pandas มีความสามารถในการจัดการ และวิเคราะห์ข้อมูลได้อย่างมีประสิทธิภาพตั้งแต่ข้อมูลขนาดเล็กไปจนถึงข้อมูลขนาดใหญ่ ทำให้ pandas ตอบโจทย์งานในยุคที่ข้อมูลมีขนาดใหญ่มากขึ้นเรื่อยๆ ได้ ไม่มีปัญหาติดขัดเหมือนกับ Spreadsheets อื่นๆ (เช่น Excel หรือ Google Sheets ซึ่งจะทำงานได้ช้าลงหากข้อมูลมีขนาดใหญ่ขึ้น)

ขั้นตอนการเตรียมข้อมูลนั้นมีความสำคัญมาก และ Data Scientist อาจจะใช้เวลาส่วนใหญ่หมดไปกับขั้นตอนนี้ เพราะหากข้อมูลที่เตรียมได้ไม่มีประสิทธิภาพ การนำ Insights ไปใช้งาน หรือนำข้อมูลไปสร้างโมเดล ย่อมทำให้ได้ข้อมูลที่ไม่น่าเชื่อถือนั่นเอง (Garbage in, Garbage out)

นอกจากนี้ เมื่อเปรียบเทียบกับ Tools วิเคราะห์ข้อมูลอื่นๆ อย่าง Excel หรือ Google Sheets อาจไม่ตอบโจทย์เต็มที่หากต้องการเชื่อมต่อกับแหล่งข้อมูลบางประเภท หรือทำ Automation (ระบบจัดการอัตโนมัติ) ในขณะที่ pandas ซึ่งเป็นส่วนหนึ่งของ Python นั้นสามารถใช้การเขียนโค้ด เพื่อปรับแต่ง หรือเชื่อมต่อกับโปรแกรมอื่นๆ ได้สะดวกนั่นเอ

ถ้าคุณมีความใฝ่ฝันอยากจะเป็น Data Scientist แล้วละก็ อย่าลืมหาเวลาศึกษา และฝึกฝน Library สำคัญๆ อย่าง pandas ให้เชี่ยวชาญ​ เพื่อให้คุณทำงานได้เต็มประสิทธิภาพ

=====================================================
🤩หากคุณพร้อมที่จะเริ่มเรียนรู้ pandas เราขอแนะนำคอร์สเรียนออนไลน์ใหม่ ที่จะให้คุณได้เรียนรู้วิธีทำงานแบบ Data Science Project ด้วย pandas ตั้งแต่เริ่มสร้างโปรเจกต์จนนำ Insights ที่ได้ไปใช้งาน สอนโดยคุณเกรท สรณภพ เทวปฏิคม Data Scientist ตัวจริงที่ INFINITAS by Krungthai.

Skooldio blog - What is pandas | Essential pandas online course

You may also like

data-driven-with-moneyball-theory
Data

MoneyBall Theory ถอดบทเรียนชัยชนะแห่งศตวรรษด้วย Data

สำหรับใครหลายๆ คนมักจะคิดว่าการใช้ Data นั้นจะถูกจำกัดไว้อยู่เพียงแค่กับการทำธุรกิจ หรือการทำวิจัยเท่านั้น แต่ความเป็นจริงแล้วข้อมูลสามารถใช้ในการวิเคราะห์ได้หลากหลายสิ่งมากๆ และอยู่ได้ในแทบทุกวงการ แม้กระทั่งกับวงการกีฬาเองที่การวิเคราะห์ข้อมูล และใช้ Data ก็สามารถทำให้ทีมได้ชัยชนะได้ไม่ยาก ย้อนกลับไปในช่วงก่อนปี 2002 วงการเบสบอลในสหรัฐอเมริกาจะมีแมวมองไปดูตามโรงเรียนมัธยมต่าง ๆ ...
Data

สร้าง Profile สาย Data ยังไงดี เมื่อบริษัทไม่ได้มองหาแค่คนมีสกิล?

อยากเป็น Data Analyst แต่ไม่มีประสบการณ์ จะเก็บโปรไฟล์ยังไงดี? หลายคนที่กำลังเรียน หรือกำลังสนใจจะเรียน Data Analytics อาจมีความกังวล เพราะแม้เราจะมีสกิลครบตามตำแหน่งงาน (SQL, Spreadsheets, Business Intelligence ...

More in:Data

อัปสกิล Data เปลี่ยน HR ธรรมดาสู่ “People Analyst” | Skooldio Blog Data

อัปสกิล Data เปลี่ยน HR ธรรมดาสู่ “People Analyst”

ในแต่ละบริษัท ฝ่าย Human Resource ถือเป็นอีกทีมหนึ่งที่เป็นกุญแจสำคัญสู่ความสำเร็จขององค์กร เพราะถือเป็นฝ่ายที่ดูแลทรัพยากรที่สำคัญที่สุดขององค์กร นั่นก็คือ “ทรัพยากรมนุษย์” เพราะฉะนั้นหากการตัดสินใจของทีม HR เป็นการตัดสินใจด้วยความรู้สึก หรือใช้ Gut Feeling อยู่ละก็ ...
รู้จักอาชีพสุดฮอตปี 2022 Sale Analyst ตำแหน่งที่ทุกบริษัทตามหา | Skooldio Blog Data

รู้จักอาชีพสุดฮอตปี 2022 Sales Analyst ตำแหน่งที่ทุกบริษัทตามหา

ทุกคนเคยสังเกตไหมว่า  Sales  ที่ประสบความสำเร็จไม่ได้เสนอขายสินค้าให้กับทุกคนที่เดินผ่าน  ไม่ได้โทรหาทุกคนที่เขามีเบอร์โทรศัพท์ และไม่ได้ส่งอีเมลหาลูกค้าทุกคน เพราะอะไรเขาถึงปล่อยโอกาสการเข้าถึงลูกค้าไปแบบนั้น?  จริงๆ แล้ว การเสนอขายสินค้าหรือบริการนั้น ถ้าทำแบบไม่มีแบบแผนก็คงจะเหนื่อย และสิ่งที่แย่ไปกว่านั้นคือ อาจจะขายได้ไม่คุ้มเหนื่อยก็ได้  เพราะเวลา และแรงของ Sales ...
5 Python Libraries ที่คนทำงานสาย Data ควรรู้จัก | Skooldio Blog Data

5 Python Libraries ที่คนทำงานสาย Data ควรรู้จัก

Python คือหนึ่งในภาษาการเขียนโปรแกรมที่ได้รับความนิยมไปทั่วโลก เพราะเป็นภาษาที่มีความสามารถรอบด้านไม่ว่าจะเป็นภาษาที่ใช้พัฒนา Web Application, การพัฒนา Backend และอื่นๆ รวมถึงการทำ Data Analytics และ Machine Learning เอง ...

Comments are closed.