Data Analytics & Artificial Intelligence
สวัสดีเหล่า Data Analysts และ Business Users ทุกท่าน ที่หลงใหลในการวิเคราะห์ข้อมูล ผู้เขียนเชื่อว่าทุกคนชอบหา Insight จากการปั้น Dashboard ด้วย Looker Studio อยู่แล้ว มีจำนวนไม่น้อยที่ดีใจเมื่อทราบข่าวว่า Looker Studio ออกเวอร์ชัน Pro ขึ้นมา แต่การอัพเกรดเวอร์ชันโปรนั้น อาจจะมีขั้นตอนในการจัดซื้อซอร์ฟแวร์เพิ่มเติมในองค์กร ข่าวดีคือ ..วันนี้พวกเราสามารถอัพเกรดเป็น Looker Studio Pro ด้วยตัวเองได้แล้ว!!!
Data Analytics & Artificial Intelligence
BigQuery เป็น Data Warehouse มีชื่อเสียงเป็นอันดับต้น ๆ ของโลกที่ Data Analyst ต้องยกนิ้วโป้งให้ ด้วยความสามารถครบครันไม่ว่าจะ ELT ในตัวด้วย Dataform ทำ Machine Learning ได้ด้วยภาษา SQL อย่าง BQML แชร์ข้อมูลให้คู่ค้า หรือ Monetize Data ได้ด้วย Analytics Hub ซึ่งวันนี้ก็เป็นอีกครั้งที่ BigQuery ก้าวข้ามผ่าน Modern Data Warehouse ธรรมดา คือสามารถเขียน Python ได้ในตัวแบบทันที ไม่ต้อง Set-up Infrastructure ขึ้นมาด้วย BigQuery Studio
Data Analytics & Artificial Intelligence
สำหรับนักทำข้อมูลไม่ว่าจะเป็น Data Scientist หรือ Data Analyst ที่คุ้นกับการเล่นแร่แปรข้อมูล และเขียน Python นั้น ปฎิเสธไม่ได้เลยว่าไม่รู้จัก Jupyter Notebook ที่เป็น Editor สำหรับอำนวยความสะดวกในการทำงานกับ Data แต่ถ้าเราเป็นคนที่ชอบใช้ Notebook บน Cloud ไม่อยากติดตั้งบนเครื่องคอมพิมเตอร์ของตัวเองก็มักจะเลือกใช้ Colab by Google กันจริงไหม ?! Colab คืออะไร? Google Colab หรือมาจาก Colaboratory เป็นบริการ Jupyter Notebook บน Cloud โดยจะมีการติดตั้ง Library พื้นฐานของ Python ในการแร่แปรข้อมูลมาให้และเข้าถึง GPU และ TPU ในการทำ Deep Learning Model ได้การใช้งาน Colab จะมีลักษณะเป็นเหมือน Jupyter Notebook […]
Data Analytics & Artificial Intelligence
เมื่อ AI เข้ามามีบทบาทในทุกมิติของการทำงานตั้งแต่การฝังกับเครื่องมือด้าน Work Collaboration อย่าง Workspace หรือการทำ Cloud Engineering ไปกับ Google Cloud และในมุมของนักวิเคราะห์ข้อมูลเองก็มีเช่นกัน ไม่ว่าจะเป็น AI ที่ช่วยเขียน SQL หรือ AI ที่ช่วยสรุปประเด็นต่าง ๆ บน Dashboard ซึ่งเนื้อหาในวันนี้จะเน้นไปที่ AI กับ Business Intelligence ตัวท็อปของ Google นั่นก็คือ Looker
Data Analytics & Artificial Intelligence
ในการทำ Data Warehouse สิ่งสำคัญที่จะลำเลียงข้อมูลมาลงเหมืองข้อมูลได้ ก็คือ Data Pipeline ซึ่งส่วนใหญ่จะเป็นข้อมูลที่เป็นลักษณะ Incremental กล่าวคือมี Record เกิดขึ้นใหม่ อาทิ Sale Transactions หรือ Logs ต่าง ๆ ก็จัดการได้ไม่ยากนัก แต่ Challenge ที่มักพบกับข้อมูลที่ไม่ได้เป็น Incremental กล่าวคือข้อมูลที่ไปแก้ใน Record เดิม ๆ อาทิ ราคาหุ้นที่เปลี่ยน, แต้มสมาชิกคงเหลือในบัญชี ที่จำเป็นต้อง sync ระหว่าง Database ต้นทาง และ Data Warehouse ใน Record เดิมเช่นกัน มิเช่นนั้นจะทำให้ Data มีความแตกต่างจนอาจทำให้เกิดความผิดพลาดได้ ซึ่งเราจะแก้ปัญหาเหล่านี้ด้วยกระบวนการ CDC ครับ
Data Analytics & Artificial Intelligence
บทความใน EP2 ที่ผ่านมาจะเป็นการติดตั้ง Oracle เพื่อเตรียมพร้อมให้ Datastream เชื่อมต่อมาครับ โดยในบทความนี้ผู้เขียนจะสาธิตถึงวิธีการสร้าง profile ที่เชื่อมต่อจาก Datastream และสร้าง Streaming Pipeline มาลงยัง BigQuery
Data Analytics & Artificial Intelligence
จากบทความที่แล้วผู้อ่านทุกท่านก็พอมีความเข้าใจมากขึ้นในกระบวนการ CDC รวมถึงขั้นตอนในการทำ data pipeline จาก Oracle มายัง BigQuery กันบ้างแล้ว สำหรับบทความนี้เราจะเริ่มจำลองตัว Oracle ขึ้นมาโดยการเตรียมลง Oracle บน Google Cloud กันครับ
Data Analytics & Artificial Intelligence
ทำความรู้จัก Fivetran ที่เป็นเครื่องมือสำหรับงานย้ายข้อมูลที่ทำงานได้โดยอัตโนมัติ สามารถส่งข้อมูลเข้าออก และข้ามแพลตฟอร์มคลาวด์ได้ โดยเราจะช่วยจัดการงานส่วนที่ใช้เวลานานที่สุดในกระบวนการ ELT ตั้งแต่การสกัดข้อมูล การจัดการข้อมูลที่เปลี่ยนแปลงโครงสร้าง และการแปลงข้อมูล
Data Analytics & Artificial Intelligence
Looker Studio Pro – Business Intelligence ที่ใช่สำหรับมือโปรอย่างคุณLooker Studio Pro – Business Intelligence ที่ใช่สำหรับมือโปรอย่างคุณLooker Studio Pro – Business Intelligence ที่ใช่สำหรับมือโปรอย่างคุณLooker Studio Pro – Business Intelligence ที่ใช่สำหรับมือโปรอย่างคุณ
Data Analytics & Artificial Intelligence
ปัจจุบันการทำ Machine Learning โมเดลมีเครื่องมือหลาย ๆ ตัวที่ช่วยให้เราสร้างโมเดลได้ง่าย ๆ แต่ทว่าการทำโมเดลผู้ใช้ก็จะต้องเข้าใจในเรื่องของ Programing Language ด้วยเช่น R Programing หรือ Python Programing ก็ดี ที่ต้องเข้าใจ Syntax ในการเขียน ซึ่งอาจเป็นข้อจำกัดสำหรับคนที่ไม่ถนัดการเขียนโปรแกรม แต่บน Google Cloud Platform เราไม่จำเป็นต้องมีทักษะเขียนโปรแกรมก็ทำ Machine Learning Model ได้ด้วย BigQuery