Data

Subquery เทคนิคง่ายๆ ช่วย query สบายกว่าที่เคย

SQL Subqueries

subquery คืออะไร

Subquery คืออะไร? Subquery เหมือนกับการ Query ในภาษา SQL หรือคือการเขียน SELECT Statement เพื่อทำการดึงข้อมูลในคอลัมน์หรือค่าในคอลัมน์จากตารางหรือฐานข้อมูลที่เราต้องการ เพื่อนำไปใช้ประโยชน์ต่อไป แต่ Subquery จะคือการ Query ซ้อน Query อีกทีหนึ่ง

SELECT column_1, column_2
FROM table1

ตัวอย่างการใช้ SELECT ใน SQL

Subquery ในภาษา SQL คือ SELECT statement ย่อยที่ถูกครอบด้วย SELECT Statement อีกอันที่ใหญ่กว่า ซึ่งบางคนก็จะเรียกว่า Inner query หรือ Nested query โดยหน้าตาของ Subquery จะสังเกตได้ง่ายๆ จากวงเล็บ นั่นคือ Query ไหนที่มีวงเล็บครอบอยู่ Query นั้นจะถูกเรียกว่า Subquery และ Query ที่อยู่ด้านนอกเรียกว่า Outer Query หรือ Main Query นั่นเอง

SELECT ...
FROM ( SELECT ...
       FROM ...)

จากคำสั่งข้างบน (SELECT ...) คือ Subquery นั่นเอง

หากใครอ่านมาถึงตรงนี้โดยที่ยังไม่รู้จักภาษา SQL สามารถอ่านเพิ่มเติมได้ที่นี่


ประโยชน์หรือข้อดีของ Subquery

Subquery สามารถคืนค่าหลายรูปแบบ 

การคืนค่าได้หลายรูปแบบนี้ทำให้เราสามารถนำไปใช้ประโยชน์ต่อได้หลายรูปแบบมากยิ่งขึ้น

  • ไม่ว่าจะเป็น Scalar ที่เป็นค่าเดียว หรือตัวเลขหนึ่งตัว เช่น SELECT COUNT (x) ก็จะได้จำนวนแถวกลับมา 1 ค่า 
  • คืนค่ากลับมาเป็นแถว 1 แถว (Single row) ,คืนค่ากลับมาเป็นคอลัมน์ 1 คอลัมน์ (Single Column) หรือคืนค่ากลับมาเป็นตาราง 1 ตาราง

Subquery สามารถเอาไปใช้ได้หลายที่ 

  • Calculated value หรือใช้ใน SELECT Clause เพื่อคำนวณค่าอะไรบางอย่างที่ไม่สามารถทำได้ในการ query ครั้งเดียว (calculated value)
  • Data source หรือใช้ใน FROM Clause / JOIN เพื่อนำข้อมูลจากหลายๆ แหล่งมาประมวลผลก่อนนำไปใช้
  • Selection criteria หรือใช้ใน WHERE Clause เพื่อเป็นเงื่อนไขในการกรองข้อมูลก่อนนำไปใช้ เช่นเลือกเฉพาะแถว 1 แถว ที่อยู่ในอีกตารางมาประมวลผลกับอีกตาราง

ตัวอย่างการใช้ Subquery

เพื่อให้เห็นภาพการใช้งาน Subquery มากขึ้น จะขอยกตัวอย่างโดยใช้ข้อมูลภาพยนตร์จากวิกิพีเดีย ที่ประกอบไปด้วย ข้อมูล 4 คอลัมน์ ดังรูป 

ตัวอย่างผลลัพธ์การ query

โดยเป็นการ Query ด้วยชุดคำสั่ง

SELECT *
FROM thai_boxoffice 
ORDER BY studio, gross

การใช้ Subquery ใน SELECT Clause

จากตัวอย่างข้างต้น แต่ละ Studio จะมีภาพยนตร์หลายเรื่อง ถ้าเราต้องการเพิ่มคอลัมน์ studio_max_gross ที่จะแสดงรายได้สูงสุดของภาพยนตร์ในค่ายนั้น สามารถทำได้โดยการเพิ่ม Subquery เข้าไป

SELECT *,
      ( SELECT MAX(gross)
        FROM thai_boxoffice
        WHERE studio = m.studio
      ) AS studio_max_gross
FROM thai_boxoffice m 
ORDER BY studio, gross

จากชุดคำสั่งข้างบน เราได้ทำการเพิ่ม Subquery เข้าไปเพื่อทำการคำนวณหาค่า MAX(gross) และเพิ่มเข้าไปเป็นคอลัมน์ใหม่ที่ชื่อว่า studio_max_gross และตั้งชื่อของตาราง (Alias) thai_boxoffice ที่ Main Query เป็น m โดยเขียนชื่อ Alias เข้ามาต่อท้าย thai_boxoffice เพื่อให้สามารถกำหนดเงื่อนไข WHERE ใน Subquery ให้ filter มาเฉพาะแถวที่ studio = m.studio (การที่เรากำหนดเงื่อนไขนี้ จะทำให้เห็นว่า subquery นี้เป็น Correlated Subquery)

ตัวอย่างผลลัพธ์จากการ Query

ผลลัพท์จากคำสั่งข้างต้น

อีกวิธีที่ทำได้ คือเราสามารถนำไปใช้ร่วมกับคำสั่ง JOIN ได้ด้วยคำสั่ง

SELECT m.*, mm.studio_max_gross 
FROM thai_boxoffice m 
JOIN ( SELECT studio, MAX(gross) AS studio_max_gross
       FROM thai_boxoffice
       GROUP BY studio
     ) mm
ON m.studio = mm.studio
ORDER BY studio, gross

การใช้ Subquery ใน WHERE Clause

จากตัวอย่างเดิม เราต้องการแสดงเฉพาะรายละเอียดภาพยนตร์ที่ทำรายได้สูงสุดของแต่ละค่าย สามารถทำได้โดยการเพิ่ม Subquery เข้าไปในเงื่อนไข

SELECT *
FROM thai_boxoffice m 
WHERE gross = ( SELECT MAX(gross)
                FROM thai_boxoffice
                WHERE studio = m.studio
              )
ORDER BY studio

จากชุดคำสั่งข้างบน เราได้ทำการเพิ่ม Subquery เข้าไปเพื่อเป็นเงื่อไขในการ filter ค่า gross จาก mainquery = MAX(gross) ของ Subquery 

ตัวอย่างผลลัพท์จากการ Query

ผลลัพท์จากคำสั่งข้างต้น

อีกวิธีที่ทำได้ คือเราสามารถนำไปใช้ร่วมกับคำสั่ง JOIN ได้ด้วยคำสั่ง

SELECT m.*
FROM thai_boxoffice m
JOIN ( SELECT studio, MAX(gross) AS studio_max_gross
       FROM thai_boxoffice
       GROUP BY studio
     ) mm
ON m.studio = mm.studio
WHEREE m.gross = mm.studio_max_gross
ORDER BY studio

นี่เป็นเพียงส่วนหนึ่งของ Subquery เท่านั้น และในความเป็นจริงก็มีวิธีอื่นที่สามารถทำให้ได้ผลลัพธ์อยู่เหมือนกัน ความเร็วในการทำงานก็อาจจะแตกต่างกันออกไป เช่น การใช้คำสั่ง JOIN  หากใครต้องการเรียนรู้เพิ่มเติมเกี่ยวกับ Subquery และคำสั่งอื่นๆ ที่จะช่วยให้คุณใช้งาน SQL ได้อย่างเต็มประสิทธิภาพมากยิ่งขึ้น สามารถทดลองเรียน ดูตัวอย่างบทเรียนพร้อมทดลองเขียนภาษา SQL ได้ที่ Advanced SQL for Data Analytics with BigQuery

Advanced SQL for Data Analytics

Patchara Boonmathanaruk
Business Development Associate | Skooldio

    You may also like

    Data

    Data-Driven พารุ่งหรือพาร่วง?

    เกือบทุกเพจการตลาดในไทย(หรือในโลกก็ตาม) ต้องเคยทำคอนเทนต์เกี่ยวกับช่วงเวลาที่ดีที่สุดที่ควรโพสต์บนแต่ละ Social Media และคอนเทนต์เหล่านี้มักจะได้รับความนิยมสูงมาก เพราะใครๆ ก็พากันกดแชร์ กด Retweet กด Tag เพื่อนมาดู ด้วยความรู้สึกตื่นเต้นราวกับได้เครื่องรางของคลัง ที่จะช่วยให้โพสต์ของพวกเขาไม่กริบอีกต่อไป ผมเชื่อว่าทุกเพจมีเจตนาที่ดีที่จะนำเสนอข้อมูลที่น่าสนใจ ...
    Data

    Data Visualization คืออะไร? แล้วทำไม Google Data Studio ถึงตอบโจทย์กับธุรกิจยุคใหม่

    ในยุค Big Data ที่มีข้อมูลดิบอยู่มหาศาล องค์กรหรือบริษัทแแทบทุกที่ต่างก็อยากเก็บข้อมูลให้มากที่สุด หลายๆ คนชอบคิดว่ายิ่งเก็บข้อมูลได้เยอะเท่าไหร่ ยิ่งดีเท่านั้น เพราะน่าจะช่วยเพิ่มโอกาสในการใช้ข้อมูลตัดสินใจทางธุรกิจได้ถูกต้องและแม่นยำยิ่งขึ้น แต่จริงๆ แล้วการเก็บข้อมูลยิ่งเยอะเท่าไหร่ ไม่ได้แปลว่ายิ่งดีขึ้นเสมอไป และนอกเหนือจากการเก็บข้อมูลแล้ว คนในองค์กรหรือบริษัทยังจะต้องสามารถในการเข้าถึงข้อมูล ผ่านเครื่องมือที่เหมาะสม ...

    More in:Data

    Data

    7 ขั้นตอนจัดระเบียบ Data ในองค์กรให้ต่อยอดง่าย ๆ สไตล์ Marie Kondo

    เชื่อหรือไม่ว่าการจัดระเบียบข้อมูลภายในองค์กรนั้น ต้องเจอปัญหาเดียวกับเจ้าของบ้านที่จัดการของในบ้านตนเอง เพียงแต่ปัญหานั้นใหญ่ และซับซ้อนกว่ากันมาก ในปัจจุบัน องค์กรเป็นจำนวมากเก็บข้อมูลที่ไร้ประโยชน์ ไม่ว่าจะเป็น Web Log, อีเมลเก่า ๆ, หรือข้อมูลลูกค้าที่ out of date ...
    Design

    เรียนรู้ตำแหน่งงานหลักใน Tech StartUp ผ่านตัวละครจากซีรีส์เรื่องดัง

    ผ่านไป 8 ตอนแล้วกับ Start-up ซีรี่ส์มาแรงส่งตรงจากเกาหลี เรื่องราวของเหล่าวัยรุ่นที่มีความฝันอยากจะปั้น Startup ของตัวเองให้ขึ้นมาเป็นบริษัทเทคชั้นนำแบบ Silicon Valley สาขาเกาหลี ตลอดทั้งเรื่องที่ผ่านมา เราได้เห็นการแข่งขันที่เข้มข้น ความยากลำบากในการสร้าง Startup ...
    design sprint and data usage in traditional companies Business

    เก็บ Data ยัน Design Sprint: ปรับธุรกิจ ด้วยวิธีคิดแบบ Startup

    “จริงๆเริ่มจากน้องชายเป็นคนเจอคลาสนี้ และขออนุมัติมาเรียนก่อนครับ แต่พอดูรายละเอียดแล้ว เลยกลายเป็นต้องแย่งกันมาลง” นี่คือคำเปิดบทสัมภาษณ์สุดน่ารักจากคุณบูม กษิดิ์เดช หวังวิทยากุล เจ้าของบริษัท DriveX ที่ทำร่วมกับน้องชาย ผู้จัดจำหน่ายและนำ Gadget เจ๋งๆขึ้นห้าง ไม่ว่าจะเป็น Gadget ...
    Data

    ทีมวิเคราะห์ข้อมูลฉบับ MIT เป็นแบบไหนกัน?

    เพราะธุรกิจทุกวันนี้ตัดสินที่ใครจะนำ Data มาวิเคราะห์ได้มีประสิทธิภาพกว่ากัน แต่ปัญหาคือหลาย ๆ องค์กรยังไม่รู้เลยว่าถ้าจะตั้งทีม Data ในบริษัทต้องทำอย่างไร? และควรมีใครบ้าง? ทาง Skooldio จึงขอหยิบเอาคำแนะนำจาก MIT Sloan School ...

    Comments are closed.