How to หา insight จากข้อมูลเชิงพื้นที่ ด้วย Data Studio และ BigQuery GIS

BigQuery GIS
How to หา insight จากข้อมูลเชิงพื้นที่ ด้วย Data Studio และ BigQuery GIS
เมื่อพูดถึง Data Warehouse เรามักจะนึกถึงระบบฐานข้อมูลขนาดใหญ่ที่มีข้อมูลระดับ Big Data ไว้เพื่อใช้ในการวิเคราะห์ต่างๆ โดยมีข้อมูลที่หลากหลายในเชิงธุรกิจ อาทิ ยอดขาย, รายชื่อลูกค้า, ร้านค้าที่ใช้บริการ ฯลฯ แต่ข้อมูลอีกรูปแบบหนึ่งที่อาจเป็นข้อจำกัดของ Data Warehouse ทั่วไป คือการวิเคราะห์ข้อมูลเชิงพื้นที่ เช่น สาขาที่ตั้ง, latitude, longitude ภูมิภาค, จังหวัด, รหัสไปรษณีย์ ร่วมกับข้อมูลทางธุรกิจที่เรามีอยู่ ซึ่งผลลัพะ์ทำให้ insight ที่ได้ยิ่งมีคุณค่ามากขึ้นและเป็นประโยชน์ต่อธุรกิจของเรา

เลือกอ่านตามหัวข้อที่สนใจ

ในอดีตเราอาจจะจำเป็นที่ต้องใช้ซอร์ฟแวร์เฉพาะทางอย่าง GIS ในการวิเคราะห์ข้อมูลเชิงภูมิศาสตร์ แต่ในปัจจุบันความสามารถเหล่านี้ถูกบรรจุอยู่ใน BigQuery แล้ว เราสามารถจัดเก็บพิกัดร้านค้า เส้นทาง หรือ ขอบเขตต่างๆ ด้วย geospatial data types ต่างๆ นำมาต่อยอดด้วย geospatial functions และสามารถนำผลลัพธ์มา visualize หรือวางแผนต่อได้อีกบน Data Studio

What is BigQuery GIS?

BigQuery GIS(Geographic Information Systems) เป็นหนึ่งในความสามารถของ BigQuery ที่ทำให้เราวิเคราะห์และ visualize ข้อมูล geospatial ใน BigQuery โดยใช้ data type และ function ในระบบภูมิศาสตร์ได้

ข้อมูลประเภท GEOGRAPHY จะอธิบายจุดที่ตั้ง (points) บนพื้นผิวโลก ชุดข้อมูลของแต่ละจุด (points) จะรวมกันเป็น lines และ polygons ซึ่งข้อมูลเหล่านี้เราสามารถสร้างจาก longitude และ latitude ที่เราเก็บไว้ใน table ด้วย function ST_GEOPOINT เป็นต้น

เรายังสามารถโหลดข้อมูลภูมิศาสตร์ที่มีความซับซ้อนจาก geospatial data format ต่อไปนี้ได้

  • Well-known text (WKT)
  • Well-known binary (WKB)
  • GeoJSON

สำหรับการโหลดข้อมูลเชิงภูมิศาสตร์เราสามารถดูเพิ่มได้ที่ Working with BigQuery GIS data

Geography functions in BigQuery GIS

Function ต่างๆ จากที่เกี่ยวข้องกับภูมิศาสตร์บน BigQuery GIS จะขึ้นต้นด้วย ST_ เช่น ST_AREA สำหรับหาพื้นที่, ST_INTERSECTS สำหรับเช็คว่ามีพื้นที่ทับซ้อนกันหรือไม่ ซึ่งมีมากกว่า 50 functions โดยสามารถแยกเป็นหมวดต่างๆ ได้ดังนี้

Category

Description

Constructors

ฟังก์ชันสำหรับสร้างค่าทางภูมิศาสตร์ใหม่จากพิกัดหรือข้อมูลที่มีอยู่

Parsers

ฟังก์ชันสำหรับสร้างค่าทางภูมิศาสตร์จาก format อื่นๆ เช่น WKT GeoJSON

Formatters

ฟังก์ชันสำหรับ export ข้อมูลทางภูมิศาสตร์ให้อยู่ใน format อื่นๆ เช่น WKT

Transformations

ฟังก์ชันที่สร้างค่าทางภูมิศาสตร์ใหม่จาก input เช่น ค่า centroid, เซ็ตของจุดที่ intersection กัน, เซ็ตของพื้นที่ที่ union กัน

Accessors

ฟังก์ชันที่ช่วยให้ได้ค่าคุณสมบัติต่างๆของค่าภูมิศาสตร์ได้ง่ายขึ้น เช่น เช็คว่ามี dimension เท่าไร, มีจำนวนจุดยอดของ polygon เท่าไร เป็นต้น

Predicates

ฟังก์ชันที่คืนค่าเป็น TRUE หรือ FALSE จากความสัมพันธ์ระหว่างค่าภูมิศษสตร์สองค่าหรือคุณสมบัติบางอย่างทางภูมิศาสตร์ มักจะใช้ในการกรองข้อมูล (filter clauses) อาทิ เช็คว่าเป็นพื้นที่ทับซ้อนกันหรือไม่

Measures

ฟังก์ชันที่คำนวณเป็นมาตรวัดในพื้นที่หนึ่งหรือหลายพื้นที่ เช่น จำนวนตารางเมตรใน polygon, ระยะทางระหว่างสองพื้นที่

Clustering

ฟังก์ชันสำหรับทำ clustering บนข้อมูลเชิงภูมิศาสตร์

สามารถดูรายละเอียดเพิ่มได้ที่ BigQuery Geography functions

Visualizing BigQuery GIS data

BigQuery GIS ช่วยให้เราสามารถแสดงผลข้อมูลทางภูมิศาสตร์บน based map ได้หลากหลายวิธีต่อไปนี้

  • Google Data Studio
  • BigQuery Geo Viz
  • Google Earth Engine
  • Jupyter notebooks

ซึ่งเราสามารถ visualize ข้อมูลได้ด้วยการคลิกเพียงครั้งเดียวนั้น ก็สามารถเห็นภาพเชิงภูมิศาสตร์ได้บน Google Data Studio หรือ GeoViz ด้วยการคลิกที่ EXPLORE DATA

Google BigQuery Visualize
Google Maps in Data Studio

Google Data Studio เป็น BI Tools จาก Google Marketing Platform ในการทำ data visualization ที่ไม่มีค่าใช้จ่ายใดๆ สามารถเชื่อมต่อกับ data source ที่หลากหลายรวมถึง BigQuery ด้วยรองรับ  geographic field types ในหลายรูปแบบ เช่น ชื่อจังหวัด, ชื่อประเทศ, latlong, รหัสไปรษณีย์ ฯลฯ รวมถึง choropleth maps ทำให้เราสามารถบิดมุมมองต่างๆ ทั้งการซูม, เปลี่ยนเป็นแผนที่ดาวเทียม และ Street View.

BI GMP
Google Cloud

สำหรับตัวอย่างการแสดงข้อมูลภูมิศาสตร์บน Data Studio สามารถอ่านเพิ่มเติมได้ที่ Visualize BigQuery GEOGRAPHY polygons with Google Data Studio

Clustering severe storms with BigQuery GIS and Data Studio

อีกหนึ่งตัวอย่างที่น่าสนใจคือ use case ต่อไปนี้ เรากำลังจะทำความเข้าใจกับพายุแต่ละแบบในแต่ละพื้นที่ (ซึ่งเก็บข้อมูลในรูปแบบ point lat,long) นอกเหนือจากการนำพายุแต่ละลูกไป visualize แล้ว เรายังสามารถทำ clustering analysis โดยจัดกลุ่มพายุแต่ละลูกเป็น cluster ตามแต่ละละแวก โดยใช้ geospatial function ที่กล่าวในหัวข้อข้างต้น นั่นคือ ST_CLUSTERDBSCAN จากนั้นจึงทำการรวมพายุแต่ละลูกที่อยู่ใน cluster เดียวกันให้กลายเป็นพื้นที่โดยใช้ ST_CONVEXHULL ในการวาดขอบเขตของมันแล้วจึงมา visualize แต่ละพื้นที่ในรูปแบบ polygons บน Data Studio

ตัวอย่าง BI แสดงผลข้อมูล

จาก dashboard ข้างต้น ทำให้เราเห็นความถี่และประเภทของพายุและการแปรผันตามทิศตะวันตกไปตะวันออก (ซ้ายไปขวา) จากน้ำท่วมบนบริเวณอ่าว (flood สีน้ำเงิน) เป็นพายุลูกเห็บ (hail สีขาว)  เป็นพายุฝนฟ้าคะนอง (thunderstorm wind สีเหลือง) ซึ่งทำให้เราได้ข้อมูลว่าถ้าอยากอาศัยในพื้นที่ที่ปลอดภัยจากพายุควรจะอาศัยที่รัฐที่อยู่บริเวณตะวันตกเฉียงเหนือ (Pacific Northwest) ซึ่งพบพายุที่ระดับรุนแรงไม่มากนัก

หากต้องการทดลอง query ข้อมูลพายุบน BigQuery public dataset สามารถใช้ SQL query ต่อไปนี้ได้เลย

with storms as (

select

st_geogpoint(event_longitude, event_latitude) as geo_point,
event_type

from `bigquery-public-data.noaa_historic_severe_storms.storms_2019`

),
storms_clustered as (

select

geo_point,
event_type,
st_clusterdbscan(geo_point, 20000, 20) over() as cluster_num

from storms

),
storm_cluster_polygons as (

select

cluster_num,
st_convexhull(st_union_agg(geo_point)) as hull,
approx_top_count(event_type, 1)[offset(0)].value as most_common_event_type

from storms_clustered
where cluster_num is not null
group by cluster_num

)
select *, st_area(hull) as cluster_area
from storm_cluster_polygons

Summary

การวิเคราะห์ข้อมูลเชิงภูมิศาสตร์บน Google Cloud ก็ไม่ต้องมี process ที่ยุ่งยากอีกต่อไปด้วย BigQuery GIS ซึ่งสามารถทำให้เราลด cost ที่เกิดขึ้นทั้งด้านเวลาและค่าใช้จ่ายที่ต้อง import/export ข้อมูลข้ามไปใช้บนเครื่องมือเฉพาะทางอื่นๆ และช่วยให้เราสามารถใช้หน่วยประมวลผลระดับสูงบน BigQuery ได้อย่างเต็มที่อีกด้วย

หากท่านใดสนใจเครื่องมือต่างๆ บนระบบ Google Cloud Platform ไม่ว่าจะเป็น AI/Machine Learning, Big Data, Data Governance หรือเครื่องมือเฉพาะทางด้านการวางแผนงานภูมิศาสตร์อย่าง MAPTIST ทาง Tangerine มีผู้เชี่ยวชาญคอยให้คำปรึกษา
สามารถ
ติดต่อได้ที่อีเมล google.sales@tangerine.co.th หรือโทร 062-992-4493 ได้ทันที

Share on social media

Tangerine Expertise

Related Solution

Expand Interests

All and More

  • All
  • Apigee
  • Application Development
  • Business Transformation
  • Cisco
  • Converged Infrastructure
  • Dell EMC
  • Dialogflow (Chatbot)
  • Event
  • G Suite
  • Google Cloud
  • Google Cloud Platform
  • Google Maps Platform
  • Google Workspace
  • Highlight
  • Huawei
  • Hybrid Cloud & Multi Cloud
  • Knowledge
  • Networking
  • Productivity & Work Transformation
  • Security
  • Smart Business Analytics & AI
  • Storage & Data Protection
  • Success Story
  • VMware
All
  • All
  • Apigee
  • Application Development
  • Business Transformation
  • Cisco
  • Converged Infrastructure
  • Dell EMC
  • Dialogflow (Chatbot)
  • Event
  • G Suite
  • Google Cloud
  • Google Cloud Platform
  • Google Maps Platform
  • Google Workspace
  • Highlight
  • Huawei
  • Hybrid Cloud & Multi Cloud
  • Knowledge
  • Networking
  • Productivity & Work Transformation
  • Security
  • Smart Business Analytics & AI
  • Storage & Data Protection
  • Success Story
  • VMware
CiscoSecurity

Cisco เตรียมยกระดับ Webex ขึ้นไปอีกขั้น ด้วย Socio Labs

ช่วงต้นเดือนกรกฎาคมที่ผ่านมา ทาง Cisco ได้ประกาศเข้า Takeover กิจการของ Socio Labs ซึ่งเป็น Platform ที่มุ่งเน้นเกี่ยวกับการจัด Virtual Event แบบครบวงจร โดย Cisco หวังว่าจะนำเทคโนโลยีของ Socio Labs เข้ามาผนวกเข้ากับ Webex เร็วๆ นี้

Google Drive
G SuiteGoogle CloudGoogle Workspace

Google ประกาศอัพเดทความปลอดภัยให้กับไฟล์เอกสาร Google Drive

ตั้งแต่วันที่ September 13, 2021 เป็นต้นไป Google Drive จะมีการอัพเดทไฟล์เอกสารที่ถูกแชร์ให้มีความปลอดภัยมากยิ่งขึ้น โดยผู้ดูแลระบบ (Super Admin) สามารถเลือกดำเนินการปรับเปลี่ยนการตั้งค่าของโดเมนลูกค้า เพื่อป้องกันปัญหาการเปลี่ยนแปลงลิงก์ของไฟล์เอกสารได้

WFH and Data Security
G SuiteGoogle CloudGoogle Workspace

อีกระดับของความปลอดภัยในการ Collaboration ในโลกแห่งการทำงานแบบ Hybrid Work ด้วย Google Workspace

วันนี้ Google มีเครื่องมือที่เพิ่มประสิทธิภาพในการติดต่อกันและทำสิ่งต่างๆ ร่วมกันได้มากขึ้นด้วย Google Workspace ไม่ว่าจะเป็นที่บ้าน ที่โรงเรียน และที่ทำงาน ซึ่งโลกปัจจุบันได้เผชิญกับวิกฤตการณ์โรคระบาดจากโควิด 19 ทำให้เกิด New normal แบบใหม่ในทุกภาคส่วน โดยเฉพาะภาคส่วนธุรกิจที่ต้องมีการปรับตัวให้สามารถทำงานได้อย่างต่อเนื่อง นับจากนั้นการทำงานแบบ Hybrid Work กลายเป็นบรรทัดฐานสำหรับพนักงานจำนวนมาก การรักษาความปลอดภัย ความเป็นส่วนตัวของข้อมูล และความไว้วางใจยังคงเป็นรากฐานที่ทำให้สามารถทำงานร่วมกันได้ทุกที่ ทุกเวลา โดย Google ได้ให้ความสำคัญในรากฐานเหล่านี้ตั้งแต่ต้น ฉะนั้นวันนี้ Google จึงได้ประกาศความสามารถใหม่ซึ่งเป็นวิธีในการเสริมความแข็งแกร่งให้กับรากฐานนี้ใน Google Workspace

Google Workspace Backup and Sync
G SuiteGoogle CloudGoogle Workspace

การเปลี่ยนแปลงโปรแกรม Backup and Sync ให้เปลี่ยนเป็น Drive for desktop

เมื่อเดือนกุมภาพันธ์ พ.ศ.2564 Google ได้มีการประกาศ รวม 2 ฟังก์ชั่นการซิงค์ที่มีอยู่ 2 ตัว คือ Backup and Sync และ Drive File Stream มาเป็นฟังก์ชั่นเดียวที่มีชื่อว่า Drive for desktop ที่จะช่วยให้การทำงานของทุกคนง่ายขึ้น โดยผลการเปลี่ยนแปลงนี้จะกระทบกับทั้งผู้ใช้งาน gmail.com, G Suite และ Google Workspace ในทุก package

BigQuery GIS
Google CloudGoogle Cloud Platform

How to หา insight จากข้อมูลเชิงพื้นที่ ด้วย Data Studio และ BigQuery GIS

เมื่อพูดถึง Data Warehouse เรามักจะนึกถึงระบบฐานข้อมูลขนาดใหญ่ที่มีข้อมูลระดับ Big Data ไว้เพื่อใช้ในการวิเคราะห์ต่างๆ โดยมีข้อมูลที่หลากหลายในเชิงธุรกิจ อาทิ ยอดขาย, รายชื่อลูกค้า, ร้านค้าที่ใช้บริการ ฯลฯ แต่ข้อมูลอีกรูปแบบหนึ่งที่อาจเป็นข้อจำกัดของ Data Warehouse ทั่วไป คือการวิเคราะห์ข้อมูลเชิงพื้นที่ เช่น สาขาที่ตั้ง, latitude, longitude ภูมิภาค, จังหวัด, รหัสไปรษณีย์ ร่วมกับข้อมูลทางธุรกิจที่เรามีอยู่ ซึ่งผลลัพะ์ทำให้ insight ที่ได้ยิ่งมีคุณค่ามากขึ้นและเป็นประโยชน์ต่อธุรกิจของเรา

Scroll to Top

ติดต่อ tangerine

Tel: +66 2 2855511   |   Email: info@tangerine.co.th




This website uses cookies to ensure you get the best experience on our website. View Privacy Policy