5 Python Libraries ที่คนทำงานสาย Data ควรรู้จัก | Skooldio Blog
Data

5 Python Libraries ที่คนทำงานสาย Data ควรรู้จัก

Python คือหนึ่งในภาษาการเขียนโปรแกรมที่ได้รับความนิยมไปทั่วโลก เพราะเป็นภาษาที่มีความสามารถรอบด้านไม่ว่าจะเป็นภาษาที่ใช้พัฒนา Web Application, การพัฒนา Backend และอื่นๆ รวมถึงการทำ Data Analytics และ Machine Learning เอง Python ก็สามารถทำได้ แถมยังทำได้ดีเสียด้วย

ภาษาสารพัดประโยชน์อย่าง Python ถ้าจะต้องจำทุกคำสั่งก็คงจะต้องใช้แรงไม่น้อย เลยมีผู้พัฒนาหลายๆ คน พยายามที่จะนำคำสั่งต่างๆ ของ Python มาสร้างเป็นชุดคำสั่ง หรือเป็น Package เพื่อให้สามารถทำงานตามวัตถุประสงค์แต่ละด้านได้อย่างมีประสิทธิภาพมากขึ้น โดยที่เรียกสิ่งที่ว่านี้ว่า “Python Library”

ในบทความนี้ Skooldio จะขอพาทุกคน ไปรู้จักกับ 5 Python Library ที่คนทำงานสาย Data อย่าง Data Analyst หรือ Data Scientist ควรรู้จักกัน

5 Python Libraries ที่คนทำงานสาย Data ควรรู้จัก | Skooldio Blog

1.NumPy

มีชื่อเต็มว่า “Numerical Python” ซึ่งแน่นอนว่า ชื่อมาขนาดนี้แล้ว NumPy ต้องโดดเด่นในในด้านการคำนวณ​ และการทำงานกับตัวเลขอย่างแน่นอน ( NumPy ถือเป็น Scientific Computing Library ที่สำคัญมากของ Python) 

นอกจากนี้ NumPy ยังมีความสามารถสำคัญในการสร้าง Array (โครงสร้างข้อมูล) และ  Multidimensional Array ได้ ทำให้การคำนวณบน Python มีความรวดเร็วมากขึ้น ซึ่งแม้ Python พื้นฐานเอง จะมี Python list ที่มีความคล้ายคลึงกับ Array แต่ NumPy สามารถจัดการข้อมูลเหล่านี้ได้เร็วกว่าการใช้ Python list ธรรมดาๆ 

NumPy จะถูกนำไปใช้พัฒนา Library อื่นอีกด้วย เช่น Matplotlib และ pandas

2.pandas

สุดยอด Library แห่งการจัดการข้อมูล (Data Wrangling/ Data Cleaning) และการวิเคราะห์ข้อมูล (Data Analysis) ถ้าใครที่เคยมีปัญหากับการต้องจัดการกับข้อมูลขนาดใหญ่แล้วละก็ คงจะต้องเคยเจอปัญหา Spreadsheets ช้า หรือไม่เสถียรแน่นอน แต่ถ้าคุณใช้ pandas ซึ่งถูกพัฒนามาเพื่อทำงานกับข้อมูลขนาดใหญ่แล้วละก็ ทุกความยุ่งยาก และปัญหาที่เคยเจอจะหมดไปทันที

pandas จะเข้ามามีบทบาทการทำงานของสายอาชีพ Data โดยเฉพาะอย่างยิ่ง Data Scientist ตั้งแต่เริ่มนำเข้าข้อมูลเลยก็ว่าได้ เพราะ pandas สามารถเชื่อมต่อการแหล่งข้อมูลได้หลากหลาย หลังจากนั้นก็สามารถจัดเตรียมข้อมูล ทำความสะอาด และจัดรูปแบบให้พร้อมกับการนำไปวิเคราะห์ จนถึงแสดงผลเบื้องต้นก็ได้

และหากคุณต้องเจอกับการทำงานรูปแบบซ้ำๆ กัน pandas ก็จะสามารถลดงานคุณได้เพียงคุณเขียน pandas อย่างมีประสิทธิภาพ

3.Matplotlib

เป็น Library อันดับหนึ่งในการสร้างกราฟ และทำ Data Visualization (คล้ายกับ MATLAB ซึ่งมาพร้อมกับ Python) โดยที่ Matplotlib สามารถสร้างกราฟได้หลายประเภทเพื่อตอบโจทย์การทำงานของผู้ใช้ให้ได้หลากหลาย เช่น กราฟเส้น แผนภูมิจุดแบบกระจัดกระจาย (Scatter Plot), กราฟแท่ง และฮิสโตแกรม, แผนภูมิบ็อกซ์และวิสเกอร์ (Box Plot หรือ Whisker Plot) และอื่นๆ 

เรียกได้ว่าถ้าคุณต้องการวาด Python ออกมาเป็นรูป Matplotlib คือสิ่งที่คุณต้องมองหา

4.Scikit Learn

เป็น Library ที่ถูกพัฒนาโดยใช้ Library สำคัญอื่นๆ ได้แก่ Numpy, SciPy และ Matplotlib ซึ่งถูกพัฒนาขึ้นเพื่อทำ Machine Learning ทั้งในรูปแบบของ Unsupervised Learning และ Supervised Learning นั่นเอง

ซึ่ง Scikit Learn จะเน้นในส่วนของการสร้างโมเดลเพื่อทำนาย/พยากรณ์ต่างๆ สามารถทำ Spam Detection, Image Recognition, Clustering หรือ Regression ก็ได้ จุดที่ต้องระวังคือ หากคุณต้องการผลที่ถูกต้อง หรือมีประสิทธิภาพสูง น่าเชื่อถือ คุณจำเป็นจะต้องมี Input Data ที่ดีด้วย และ NumPy และ pandas มักเป็น 2 เครื่องมือที่ถูกเลือกใช้ก่อนการป้อนข้อมูลลงใน Model นั่นเอง

5. Tensorflow

สำหรับคนที่อยากเป็น Data Scientist, Machine Learning Engineer หรือ Deep Learning Engineer ต้องรู้จัก Tensorflow เพราะเป็น Library ที่พัฒนาขึ้นเพื่อการทำงาน Machine Learning / AI โดยเฉพาะ (พัฒนาโดยทีม Google Brain Team)

ความสามารถของ TensorFlow จะอยู่ที่การแบ่งแยก (Classification) การรับรู้ และจดจำ (Perception and Understanding) การพยากรณ์ผล (Prediction) เป็นต้น

ซึ่งก่อให้เกิดเทคโนโลยีที่มีความสามารถต่อๆ เช่น

  • Voice/ Sound Recognition
  • Sentiment Analysis
  • Text-Based Apps
  • Face Recognition
  • Time Series
  • Video Detection

::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::

หากใครที่อ่านแล้วรู้สึกอยากจะอัปสกิล Python โดยเฉพาะอย่างยิ่งด้าน Data แล้วละก็ Skooldio ขอแนะนำคอร์สออนไลน์ที่สอนให้คุณทำงานกับโปรเจกต์จริงตั้งแต่เริ่มต้น จนนำ Ingishts ไปใช้งานได้จริงกับคอร์ส Essential pandas for Data Science ที่ครอบคลุมพื้นฐาน NumPy ที่จำเป็น และเน้น pandas อย่างเข้มข้นตลอด 16 – 18 ชั่วโมง 

5 Python Libraries ที่คนทำงานสาย Data ควรรู้จัก | Skooldio Blogคอร์สนี้สอนโดย คุณเกรท สรณภพ เทวปฏิคม Data Scientist ที่ INFINITAS by Krungthai ผู้ผ่านประสบการณ์การทำงานกับข้อมูลขนาดใหญ่ และเข้าใจปัญหาที่ Data Scientist ต้องเจอะเจอจริงๆ ที่อาจไม่ได้ถูกเขียนไว้ในตำรา

ดูรายละเอียดคอร์สและสมัครเรียนได้ที่นี่


ที่มา:

 

You may also like

อัปสกิล Data เปลี่ยน HR ธรรมดาสู่ “People Analyst” | Skooldio Blog
Data

อัปสกิล Data เปลี่ยน HR ธรรมดาสู่ “People Analyst”

ในแต่ละบริษัท ฝ่าย Human Resource ถือเป็นอีกทีมหนึ่งที่เป็นกุญแจสำคัญสู่ความสำเร็จขององค์กร เพราะถือเป็นฝ่ายที่ดูแลทรัพยากรที่สำคัญที่สุดขององค์กร นั่นก็คือ “ทรัพยากรมนุษย์” เพราะฉะนั้นหากการตัดสินใจของทีม HR เป็นการตัดสินใจด้วยความรู้สึก หรือใช้ Gut Feeling อยู่ละก็ ...

More in:Data

รู้จักอาชีพสุดฮอตปี 2022 Sale Analyst ตำแหน่งที่ทุกบริษัทตามหา | Skooldio Blog Data

รู้จักอาชีพสุดฮอตปี 2022 Sales Analyst ตำแหน่งที่ทุกบริษัทตามหา

ทุกคนเคยสังเกตไหมว่า  Sales  ที่ประสบความสำเร็จไม่ได้เสนอขายสินค้าให้กับทุกคนที่เดินผ่าน  ไม่ได้โทรหาทุกคนที่เขามีเบอร์โทรศัพท์ และไม่ได้ส่งอีเมลหาลูกค้าทุกคน เพราะอะไรเขาถึงปล่อยโอกาสการเข้าถึงลูกค้าไปแบบนั้น?  จริงๆ แล้ว การเสนอขายสินค้าหรือบริการนั้น ถ้าทำแบบไม่มีแบบแผนก็คงจะเหนื่อย และสิ่งที่แย่ไปกว่านั้นคือ อาจจะขายได้ไม่คุ้มเหนื่อยก็ได้  เพราะเวลา และแรงของ Sales ...
รู้จัก pandas - Library อันดับ 1 สำหรับการทำ Data Analysis | Skooldio Blog Data

รู้จัก pandas – Library อันดับ 1 สำหรับการทำ Data Analysis

เคยได้ยินคนพูดถึงบ่อยๆ แต่ไม่รู้ว่า pandas คืออะไร? เราไม่อยากให้ความไม่รู้ของคุณทำให้คุณพลาดโอกาสดีๆ ที่จะได้รู้จักกับ Library อันดับ 1 สำหรับการทำ Data Analysis ในบทความนี้ เราจะมาทำความรู้จัก Pandas ...
5 Business Metrics ที่คนทำธุรกิจต้องรู้| Skooldio Blog Business

5 Business Metrics ที่คนทำงานสายธุรกิจต้องรู้!!

คนทำงานสายธุรกิจยุคใหม่ ไม่ว่าจะเป็นตำแหน่งปฏิบัติการอย่าง Sales, Marketing, Analyst หรือจะเป็นตำแหน่งใหญ่ๆ อย่าง  Project Manager  ถ้าอยากจะทำผลงานให้ได้ดีเหนือคู่แข่ง ก็ต้องมีการใช้ Data ในการวางแผนกลยุทธ์ และวัดผลอยู่ตลอดเวลา เพื่อให้ไม่พลาดทุกโอกาสสำคัญทางธุรกิจ  ...

Comments are closed.