Intro to Data Science and Cloud

เริ่มต้นใช้งาน Google Cloud Platform

🏆 ระดับเริ่มต้น 📽 9 วีดีโอ 2 ชั่วโมง 🚀 ฟรี ไม่มีค่าใช้จ่าย

Quick Intro

“Every Company is a Data Company” – Google

พูดคุยเรื่อง data science แบบชิลๆ เข้าใจง่าย

คลิกเพื่อดู Data Science Venn Diagram ต้นฉบับโดย Drew Convey ปี 2010 ประกอบด้วย Computer Science, Math and Stats, Domain Expertise

ตำแหน่งอาชีพในสายงาน data science

Note – อาชีพในงาน data จริงๆมีมากกว่าที่เราอธิบายในวีดีโอ ยังมีทีมฝั่ง Business Intelligence (BI) หรือ Architect ที่ช่วยดูแลระบบในบริษัทด้วย

ทำความรู้จัก cloud computing/ services

Note – Cloud เปรียบเทียบง่ายๆก็เหมือนกับ Internet รับส่งข้อมูลกันผ่านโครงข่าย fiber optic cable (sub-sea) ที่ลากสายผ่านมหาสมุทรเชื่อมต่อทั้งโลกเข้าด้วยกัน

Hands-On Labs

สมัคร Google Cloud Platform (Free Tier) ได้ที่นี่ https://cloud.google.com/free

Lab – สร้างบัญชี Google Cloud Platform (Free Tier)

ผู้ให้บริการ Cloud รายใหญ่ในตลาดคือ Amazon AWS, Microsoft Azure และ Google Cloud Platform ตามลำดับ (ด้าน Market Share กูเกิ้ลยังตามหลังคนอื่นอีกพอสมควร แต่มี AI/ML เป็นจุดแข็ง ไม่เป็นสองรองใคร)

Lab – สร้าง Cloud Storage Bucket

Cloud Storage คือ object storage ที่เหมาะสำหรับเก็บไฟล์ขนาดใหญ่ เราสร้าง bucket ไว้เก็บข้อมูล สามารถเปิดแบบ public เพื่อแชร์ url ให้คนอื่นได้

Lab – สร้าง Compute Engine

Note – ราคาของ preemptible VM ถูกกว่าแบบปกติ เพราะว่ามันจะถูก terminate หลังจากรันครบ 24 ชั่วโมง (short-lived) และอาจถูกปิดและดึง resource ไปใช้กับงานอื่นๆ (i.e. preempt) โดยไม่ต้องแจ้งล่วงหน้า

Lab – วิเคราะห์ข้อมูลด้วย BigQuery

Note – สำหรับ SQL พื้นฐานที่ควรรู้จักมีอยู่แค่สามตัวคือ SELECT, WHERE และ JOIN (เราไม่ได้อธิบาย join ในวีดีโอ แต่มันใช้สำหรับดึงข้อมูลจากหลายๆตารางพร้อมกัน)

Lab – เขียนโค้ด R/ Python บน GCP AI Notebooks

Jupyter คือ web-based development สำหรับงาน data science โดยสามภาษาหลักที่รองรับคือ Julia, Python, R (ที่มาของชื่อ Jupyter) ปัจจุบันรองรับมากกว่า 40 ภาษา

Bonus Lab – สร้างโมเดล Linear Regression ด้วยโปรแกรม Excel

ตัวอย่างนี้เราสอนใช้ Analysis Toolpak เพื่อวิเคราะห์ข้อมูลสถิติใน Excel แบบไม่ต้องเขียนสูตรเลย

Review

  • คอร์สนี้เราเรียนการใช้งาน Google Cloud Platform เบื้องต้น
  • องค์ประกอบพื้นฐานของ Cloud คือ Compute, Storage, Network
  • Cloud Storage ใช้เก็บข้อมูล
  • Compute Engine คือ Virtual Machine ที่จำลองการทำงานเหมือนกับคอมพิวเตอร์จริงๆ (อ่านเพิ่มเติมเรื่อง Hypervisor ได้ที่นี่)
  • BigQuery ใช้รัน SQL เพื่อวิเคราะห์ข้อมูลขนาดใหญ่
  • AI Notebooks เขียนโค้ดบนคลาวด์ ทำงานด้าน Data

Sign Me Up!

สำหรับเพื่อนๆที่สนใจ สามารถใส่อีเมล์เพื่อรับข่าวสาร และรับส่วนลดคอร์สเรียนออนไลน์ใหม่ของเรา เริ่มตั้งแต่เดือน เม.ย. 2563 เป็นต้นไป ตัวอย่างคอร์สเรียนใหม่ เช่น

  • Getting Started with Microsoft Excel
  • Intro to Python for Computing
  • Intro to R for Data Science
  • Command Line Basics
  • Build WordPress Website in Two Hours

Processing…
Success! You’re on the list.