IT의 중심에서

나이 든 개발자가 살고 있는 IT 현장 이야기

Where2.0 2011 W/S Day

올해 4.19 일부터 실리콘 밸리에서 where2.0 conference 가 있었습니다.
이 행사는 O’Reilly 가 주최하는 행사로 주로 GIS, Location 비즈니스와 기술들을 발표하는 행사였습니다.

Workshop day까지 포함해서 공식적으로 83개의 발표가 있었고, Ignite Session 까지 포함하면 90여개 이상의 발표가 있었습니다.
2박3일의 짧은 일정이었지만, 쉬워 보이는 발표는 거의 없었던 것 같네요.

우선 키노트가 궁금하신 분들은 아래 유튜브를 참조하세요.

http://where2conf.com/where2011/public/content/video

키노트를 통해 제가 받은 느낌은, Business에서는 Location에 대한 “Check-in”,”Story” 였고,
Technical에서는 “Big geodata” 와 “Spatial Analysis”가 올해의 화두라는 생각이 들었습니다.
아마 내년에는 이와 관련된 “앱”이나 모바일웹이 많이 등장하겠지요.

* 첫날 (2011.04.19)

첫 날은 Workshop Day로 주로 기술적인 내용들만 다루었는데요.
이미 많은 곳에서 “공간DB”를 다루기 위해 다양한 기술들이 사용되고 있음을 알 수 있었습니다.

09:00am – Real-Time Geo
1) Raffi Krikorian (Twitter)
2) http://www.flickr.com/photos/luckyxrea/sets/72157626533252296/
3) 트위터가 어떻게 place enable하기 위해 아키텍쳐를 만들고, Ecosystem을 설계했는가를 보여주는 발표였습니다.
– Keyword : “real-time geo”
4) Simplified Architecture
– R-Tree for Spatial Lookup (Data provider, R-Tree내에 place object 저장)
– Mapping from ID to place object
5) JTS(Java Topology Suite)
http://www.vividsolutions.com/jts/jtshome.htm
– R-Tree구현을 포함하고 있고 “Geomeries”를 핸들링하기에 좋음
6) GeoRuby
http://georuby.rubyforge.org
– Geometric Entity를 표현하기 위해 적당함
7) Extraction
– Text를 읽고, 문맥을 이해해야 함. (장소에 대한 이야기인지, 장소에서 하는 이야기인지 모름)
– Geocoder를 통해 위치를 찾아내고, Crawling을 통해 구조화된 url을 추출
8) 시사점 : Location data를 아무렇게나 쌓는 경우 나중에 Text mining 을 통해 유의한 분석을 해야 하는데, 이게 매우 어렵다는 이야기를 했습니다. Twitter는 아키텍쳐를 단순화하고, 공간분석이 용이한 구조로 DB로 바꿈으로써, Social Platform에서 Location Business 를 쉽게 도출할 수 있게 했다고 합니다.
그리고 이런 것을 오픈 소스를 활용하여 이를 달성했다고 하니, 그들의 많은 고민의 시간들에 공감이 갔습니다.

09:00am – Mining the Geo Needles In The Social Haystack (Mattew A. Russell, @ptwobrussell)
“소셜이라는 건초더미에서 Geo라는 바늘찾기”
1) Slides: http://where2conf.com/where2011/public/schedule/detail/17299
2) http://www.slideshare.net/ptwobrussell/mining-the-geo-needles-in-the-social-haystack
3) social 사이트나 DB로부터 geo data를 저장,분석,시각화하는 방법에 대한 내용의 발표였습니다.
4) 데이터 Handling을 위해 microformat을 사용(JSON,KML)
5) Twitter – JSON을 이용하여 유저 profile로부터 위치정보를 검색. 타임라인으로부터 geo data를 정제를 하거나 읽어내는 건 쉽지 않다. 다음번에 이야기하자. (접근할 때 Oauth를 사용하세요.)
6) LinkedIn – user profile에 대략의 geodata가 있음. Google Map Geocode 함수를 통해 위경도 추출
7) Clustering – approximate matching을 이용해서 data를 grouping한다. (k-means Algorithm을 활용)
8) Facebook – FB플랫폼을 이용하면,모든 종류의 data확보가 가능하다(Current location, hometown,checkins). Social Graph, FQL을 활용하라.
9) Textmining – Google Buzz나, 블로그 상의 자연어 처리 활용(어렵다)
10) Tool – NLTK, datasciencetoolkit, WordNet
11) 시사점 : geo data를 잘 활용할 수 있게끔. 정형화된 패턴을 삽입하지 않으면, 기술적으로 geo data를 추출하고, 가공하는데 굉장히 많은 노력들이 든다는 내용이었습니다.

10:35am – Tell Me More – Why Data Collection Must Extend Beyond the Check-in
“왜 체크인 이상의 데이터를 수집해야 하는가?”
1) Locationlabs (http://locationlabs.com), Scott Hotes
2) 데이터를 추출함으로써 무엇이 모바일 유저에게 의미있는 정보인가를 결정하는 능력이야 말로 앱이나 플랫폼을 만들 때 가치를 만들어내기 위한 핵심이다.(당연한 말씀)
3) “Place” Clearinghouse라는 것을 중심에 두고 Crowd Sourcing, 구조화 등 일련의 작업이 일어나는 비전을 추구하고 있음
4) Spatial Storage, Cloud는 commodity화 되고 있다. NoSQL은 Spatial에도 있다. 잘 활용하자.
5) 시사점 : “Place”라는 주제를 가지고 Global Biz 모델과 Ecosystem을 만들고자 하는 회사였습니다.

1:00pm – Hands on Map Scripting
1) Adam DuVander (ProgrammableWeb)
2) Mapstraction (Map Abstraction) : http://mapstraction.appspot.com/ (세부 예제들)
3) Slides : http://mapscripting.com/map-scripting-design
– Election map(http://www.mapmash.in/election_map.html) : 투표 시뮬레이션 스크립트 예제
– Map Warper beta(http://warper.geothings.net/) : 맵 오류 수정도구
– CloudMade Style Editor (http://maps.cloudmade.com/editor) : 다양한 스타일의 맵이 가능하도록 Stylesheet 같은 것을 제공하는 기능.
– Tile Drawer(http://tiledrawer.com/) : 간단한 방식으로 자신만의 타일맵을 서비스할 수 있게 서버와 Instance를 제공해주는 서비스
– 8 bit NYC (http://8bitcity.com/map?NewYork) : 게임같은데 활용할 수 있도록 8비트 맵 스타일을 제공하는 방식입니다.
– Auto-swapping map(http://mapscripting.com/examples/nestoria/swap.html) : Drag하면 지도가 바뀝니다. 두개의 지도가 마치 하나처럼

1:00pm – Nokia Location API Family for Desktop and Mobile
1) Nokia Map API가 deCarte와 관련이 있을까 해서 들었습니다.
2) OVI map service에 대한 설명이었습니다.
3) http://api.maps.ovi.com/playground2/ (웹개발자용)
4) http://api.maps.ovi.com/devguide/overview.html
5) API 제공 : POI, 검색, Geocoding, Routing, W3C browser 지원, 기타 SVG포맷 지원 등
6) 시사점 : Nokia도 Web을 가지고 있고, API형태로 제공합니다.
Navigation 수준의 Routing이 서버와 폰에 포팅되어 있는 것 같았습니다.
지도관련 API를 deCarte가 준 걸로 알고 있습니다. 지도 데이터는 Navteq 맵을 사용합니다.
Nokia가 스마트폰 환경을 따라잡지 못해서 그런지, 참석자가 별로 없었습니다.

2:35pm – Geo-Analytics Tutorial
1) LinkedIn, Sr.Data Scientist
2) Hadoop, Python, Pig를 이용해서 대용량 공간데이터를 분석하는 예제 작업
3) Data는 커진다 : NYSE 1TB/day, Facebook : 20+TB compress/day 등등등
4) Spatial Analysis
– Spatial Regression : 변수간의 의존성을 예측할 때 사용
– Gravity model : 두 지점 간의 사람들, 물류, 정보의 흐름을 예측할 때
– Spatial Interpolation : 측정값에 근거하여 관찰되지 않은 위치상의 변수들을 예측할 때
– Simulation : 공간 현상을 예측하기 위해 사용되는 데이터나 모델.
5) 사용된 툴 : Hadoop, Amazon EC2, Mechanical Turk
6) 데이터 출처 : SimpleGeo, Factual, Geonames, Infochimps, Data.gov, DataWrangling.com
7) 사람의 수작업이 필요한 곳은 Amazon의 Mechanical Turk를 활용합니다.
8) 시사점 : Global, Mass data handling을 위해서는 Cloud, NoSQL의 Spatial Processing을 사용하자는 이야기었습니다.

3:55pm – Working with Geo Data in Mongo DB
1) Bernie Hackett, MongoDB spatial Query에 대한 개발자 실습
2) http://www.mongodb.org/display/DOCS/Geospatial+Indexing
3) 시사점 : Mongo DB는 Document기반의 NoSQL기반의 분산형DB 대표주자이죠. Spatial Function을 지원한다고 하니, 응용분야가 꽤 있을 것 같습니다.

Advertisements

답글 남기기

아래 항목을 채우거나 오른쪽 아이콘 중 하나를 클릭하여 로그 인 하세요:

WordPress.com 로고

WordPress.com의 계정을 사용하여 댓글을 남깁니다. 로그아웃 / 변경 )

Twitter 사진

Twitter의 계정을 사용하여 댓글을 남깁니다. 로그아웃 / 변경 )

Facebook 사진

Facebook의 계정을 사용하여 댓글을 남깁니다. 로그아웃 / 변경 )

Google+ photo

Google+의 계정을 사용하여 댓글을 남깁니다. 로그아웃 / 변경 )

%s에 연결하는 중

정보

이 엔트리는 2011년 6월 1일에 님이 API와 기술에 게시하였으며 , , , , 태그가 지정되었습니다.

내비게이션

%d 블로거가 이것을 좋아합니다: