2025-08-27

Aug 27, 2025

polars is faster than pandas. But when it comes to spatial operations everyone fallbacks to geopandas, especially when it comes to reading geoparquet files.

I find this very amusing, but personally I use spark sedona 😛


โลกนี้มี polars ที่ไวกว่า pandas

แต่บทต้องทำ spatial operations ทุกคนใน polars ecosystem พร้อมใจกันไปยืมมือ geopandas

โดยเฉพาะตอนอ่าน geoparquet สุดท้ายโดนไล่ไปคุยผ่าน geopandas parquet reader ตายที่ parsing bottleneck อยู่ดี

WKB/WKT/geometry column อีกล้านแปด ที่แต่ละ implementation คุยกันคนละอย่าง เพราะแต่ละยี่ห้อมอง geometry column คนละแบบ

แต่ถ้าเจ็บทีเดียวแต่จบ จะแนะนำ spark sedona เล่นใหญ่หน่อย แต่จบทุกงานจริงๆ

https://karnwong.me/posts/rss.xml