สรุปเซสชั่น Google Keynote ในงาน Google I/O Extended 2024 โดยคุณ Janise Tan, Developer Relations Ecosystem Google
คุณ Janise เริ่มพูดถึง AI ที่เข้ามาเปลี่ยนแปลงครั้งใหญ่ ไม่ว่าคุณจะเป็นนักพัฒนาเว็บ นักพัฒนา Android หรือวิศวกร AI ตอนนี้ AI กำลังถูกเชื่อมโยงเข้าไปทุกที่ และ Google ก็เป็นผู้นำการอัปเดต AI นี้มาตั้งแต่ TensorFlow ไปจนถึงการเป็นผู้เปิดเผย Sourcecode เทคโนโลยี Transformer และตอนนี้มี Gemini รวมถึงโมเดล Open Source อย่าง Gemma
ปีนี้เราประกาศ Gemini 1.5 ที่งาน I/O มี 2 โมเดล หนึ่งคือ 1.5 Pro ซึ่งเป็นโมเดลที่ก้าวหน้าที่สุดของเราซึ่งรองรับ Context Window ได้ 2 ล้านคำ! และอีกโมเดลใหม่ล่าสุดที่เปิดตัวที่ I/O คือ 1.5 Flash ซึ่งมีเวลาตอบสนองที่เร็วขึ้น มีความหน่วงต่ำ ตอบสนองภายใน 1 นาที และให้ผลลัพธ์ที่น่าประทับใจมาก สำหรับการใช้งานที่แตกต่างกัน
คุณอาจเคยได้ยินเกี่ยวกับ Gemini Nano ซึ่งเป็นโมเดลที่เล็กที่สุดของเรา ที่คุณสามารถทำ ML บนอุปกรณ์ได้ สำหรับนักพัฒนา Android และเว็บ นี่เป็นสิ่งที่คุณสามารถศึกษาได้
AI Studio น่าจะเป็นระดับเริ่มต้นที่สุดสำหรับ Developer เมื่อคุณใช้ AI Studio มันช่วยคุณสร้างโค้ดและเพิ่มประสิทธิภาพในการทำงาน แต่ถ้าคุณคิดจะทำอะไรที่ advance ขึ้น Gemini API คือที่ที่คุณสามารถเริ่มสร้างโปรเจ็กต์ได้ เราอยากให้คุณลองใช้ API เพื่อสร้างโปรเจ็กต์ที่คุณหลงใหล คุณสามารถเริ่มต้นด้วย API cookbook มีเนื้อหามากมายที่พร้อมใช้งานแล้ว (ซึ่ง developer หลายคนกำลังแชร์โปรเจ็กต์ของตัวเองในงานวันนี้ด้วย)
เรายังมี Coding Assistant ที่คุณสามารถค้นหาออนไลน์ได้ Generative Media เป็นเรื่องสนุกและเข้าถึงง่าย ถ้าคุณมีเพื่อนหรือครอบครัวที่สงสัยว่า AI มีอะไรน่าตื่นเต้น นี่เป็นจุดเริ่มต้นที่ดีในการทดลอง
Music FX ก็สนุกมากสำหรับใครที่อยากเป็น DJ คุณสามารถลองได้ ส่วน Video FX ยังไม่เปิดให้ใช้งานแบบ public ยังอยู่ในช่วง Early Access และฟีเจอร์ create ภาพก็กำลังจะเปิดตัวเร็ว ๆ นี้
นอกจากนี้คุณ Janise ยังมาแชร์ 4 โปรเจกต์สุด inspire ที่ทีม Google Developer experts ได้สร้างขึ้นมา
Table of Contents
4 โปรเจกต์จาก Google Developer experts
1. Hand Sign Real time Detection and Translation
สร้างโดยหนึ่งใน Google Developer experts ประเทศอินโดนีเซีย ใช้ Gemini 1.0 Vision Pro เพื่อแปลภาษามือและสร้างคำบรรยายบนหน้าจอสำหรับงานอีเวนต์ ช่วยให้ผู้พิการทางการได้ยินสามารถแบ่งปันความรู้กับผู้อื่นได้
2. แอป TL;DR (Too Long; Didn’t Read)
สร้างโดยหนึ่งใน Google Developer experts ที่จะพูดในวันนี้ แอปนี้ช่วยสรุปเนื้อหาจาก URL ที่เราใส่เข้าไป เป็นภาษาอะไรก็ได้
3. Baojai : Your courageous Guide to Emotional Well-Being
แอปฮีลใจ สร้างขึ้นเพื่อช่วยดูแลสุขภาพทางอารมณ์ของคุณ
4. LINE Conference Chatbot
Chatbot สำหรับการประชุม ช่วยให้ผู้ใช้ถามคำถามเกี่ยวกับงานประชุม และได้รับคำตอบ โดยอิงข้อมูลจากตารางการประชุมและคลังข้อมูลที่เตรียมไว้ แถมยังรองรับการสนทนาแบบต่อเนื่อง โดยสามารถจำข้อมูลการถาม-ตอบก่อนหน้าของผู้ใช้ได้