財經365訊 國內頂級程序設計賽事——鏈家算法大賽暨2017計蒜之道總決賽于8月13日在鏈家總部開賽。鏈家特地開放了多年積累的龐大、真實的房屋數據,選手們通過特征工程和模型算法的訓練研發,對房屋價格進行估算,展現了一場房地產與大數據的精彩碰撞。
開放數據,理論聯系實際生活
此次算法大賽主要面向愛好計算機科學的大、中、小學生以及社會人士,意在為計算機科學的學習者們提供一個競技、交流的平臺。
此次大賽側重比賽內容的實用價值——對當下公眾普遍關注的房屋價格進行預估。比賽的試題全部來源于鏈家2016年下半年至2017年8月上旬期間在北京成交的部分房源的真實數據,在對房源信息做了脫敏處理之后,要求參賽者根據房屋朝向、居室、掛牌價等公開數據進行特征工程和模型算法的訓練研發,產生機器學習算法模型,分別從多個角度對一套房屋的市場價格進行預估。最終,以準確率更高的算法勝出,加入到鏈家房屋智能評估系統的實際算法應用中去。
大賽現場,鏈家技術副總裁惠新宸在致辭中表示,鏈家此次舉辦算法大賽,開放真實的房源數據,就是希望能讓專業領域的學生在學習過程中突破理論,與實際生活相結合。同時,鏈家也期望有更多優秀的程序設計人才加入企業,一起將數據背后的價值挖掘出來。
在技術驅動的信息時代,頂尖算法和程序設計人才已經成為行業乃至社會創新的新動力。計蒜之道程序設計大賽自2015年舉辦以來,不僅為國內外計算機科學愛好者提供一個競技交流的平臺,同時攜手業界知名科技企業一同挖掘優秀人才,微軟、滴滴和鏈家先后成為這個優秀賽事的主辦方。
真實應用,推動大數據產品化
此次算法大賽是基于鏈家房屋智能評估系統,系統在買家,賣家,經紀人三方的交易中扮演著價值信息錨點的作用。
房屋智能評估系統基于鏈家多年積累的海量真實成交數據、掛牌數據,帶看數據和樓盤字典數據,通過系列機器學習算法,智能估算房子成交時的可能市場成交價格,以方便所有使用者平等便捷地得到完全中立的房屋價值信息。
模型使用了房子的基本特征、周邊屬性,也加入了對市場的洞察。
從使用上來說,用戶可以直接輸入具體的房屋地址然后便捷地進行價值評估,也可以只告訴系統所需評估房源的基本信息,系統就會實時給出這套房子在未來的靠譜的可能的成交價格。
估價系統背后是一系列的子模型,通過STACKING的方式結合起來進行聯合預測。每個子模型考慮了不同的特征組合,分別從多個角度來擬合房屋的價格;每個子模型的算法也不盡相同,其中包括了ANN,GBDT, RANDOM FOREST 和HEDONIC等經典的機器學習算法。簡而言之,就是通過模型組合方式進行聯合預測。
鏈家的房屋智能評估系統的準確率目前處于國際領先水平,已支持多個城市的房屋估價功能,包括北京,南京,深圳,天津,成都,杭州等。
可以說,鏈家房屋智能評估系統是人工智能和大數據技術在二手房交易領域的一次成功的應用。
技術附能,提升品質化服務
作為年交易規模超過16萬億元的中國第二大行業,房地產服務還有很大的優化空間。對消費者而言,交易過程中,信息的真實可靠直接決定交易感受,甚至會影響決策。這就對數據提供了高要求:數據更準確,定位更精準。
致力于打造“住”的入口的鏈家,一直在通過數據不斷提升服務品質。
作為以數據驅動的全價值鏈房產服務平臺,鏈家集房產交易平臺、房產信息平臺和服務者生態平臺為一體。按照鏈家集團CEO彭永東的設想,“哪些房子更有可能拿出來賣,什么樣的房子成交的可能性更高,這些都可以通過數據進行相應的分析?!?/span>
鏈家擁有業內獨有的海量真實數據,無論是通過真房源系統辨別真假房源,利用房屋智能評估系統評估房屋價值,還是依靠可視化服務掌握交易流程,無一不說明鏈家獨有的數據實力。
目前,鏈家擁有業內獨有的房屋數據、人群數據、交易數據。從2008年開始建立“樓盤字典”,目前已囊括全國36個城市7500萬套房屋的標準信息,擁有1200TB數據量,每套房屋由300個字段描述,還用107個維度定義用戶,125個維度定義經紀人,在此基礎上形成的包括帶看、交易在內的行為數據,每天超過30G。鏈家依靠“樓盤字典”打造出“地圖找房”、“房屋智能估價系統”等大數據產品,為提升交易效率、改善用戶體驗、升級服務品質不斷努力和嘗試。
通過交易流程的可視化、信息無差別分享以及安心服務承諾等保障每位消費者的權益,鏈家“鏈接人與服務”, 讓每個買房人、賣房人、經紀人順暢交互,為用戶提供更安全、更便捷、更舒心的綜合房產服務。(原標題:鏈家為頂級程序設計大賽開放真實房屋大數據)
免責聲明:本網站所有信息,并不代表本站贊同其觀點和對其真實性負責,投資者據此操作,風險請自擔