還記得那個關於大資料採礦的經典案例嗎? 掌握海量資訊的商店甚至會比一個母親更先知道她的女兒已經懷孕。 而備考題庫產品猿題庫的產品願景也類似:在考試方面,它要做到比你自己更瞭解你,從而説明你更有效率地練習。 你哪道題不會,什麼地方有遺漏,它都會告訴你;如果你練習得夠勤快,它還可以告訴你,在尚未舉行的考試中,你能拿到多少分。
這也正是猿題庫的CEO李勇強調自己做的其實是大資料業務的原因。 他說,猿題庫做的就是通過人工智慧演算法對考點、考頻和難度進行分析,基於大資料採礦準確評估出使用者當前的能力水準,做到一對一的針對性出題。
昨日上線的猿題庫司考-國家司法考試,是猿題庫推出的第二個備考題庫類產品。 此前的猿題庫-公務員考試系列已經在兩個多月內吸引了20萬的註冊使用者,並預計在今年會達到150萬。 在先嘗試過社區平臺類產品粉筆網之後,李勇團隊選擇從資格考試備考這個小角度,再次切入到線上教育中。
「和很多教育類網站不同,猿題庫並不是簡單地想把線下的內容搬到線上,而要是把運算和雲服務帶到傳統教育中去。 所以我們實際上是一個雲計算公司。 這件事沒有人幹,但是很有價值。 」
李勇說:「事實表明,使用者對互聯網背靠產品的接受意願,是比我們想的要樂觀很多,雲計算和資料採礦能發揮很大的作用,考生的行為也能參與到產品完善中來,再加上移動互聯網,這個產品發展的比預想的好很多。 」
職業考試備考是強需求,使用者們都是主動在各大網站和論壇上找資訊,所以產品並不難接觸到使用者,但使用者對產品品質高度敏感,所以李勇團隊的做法就是,和傳統機構合作保證內容專業性,再利用資料採礦技術和使用者體驗來構建自己的核心價值。
李勇說,在傳統教育方式中,無論是題庫準備還是能力測試,建立模型時賦值的方法都很粗暴,主要是憑藉老師的經驗來進行,並且很難根據考生的表現來優化。 但是對於猿題庫來說,則會分成兩步走:在產品剛推出來、還沒積累起有效資料時,他們會先採取經驗賦值,但是隨著使用者資料的積累,他們基於專案反應理論、遺傳基因演算法、和艾賓浩斯記憶曲線建立起來的演算法模型就會發揮價值, 讓每一個使用者做的試卷都不一樣。
而且,傳統教育的資料處理是樣本式的,而猿題庫只要有使用者進行練習後,就能開始收集資料,全部使用者行為都是資料來源,一旦不再需要樣本,資料值的標籤就特別大,可以把偏差減到最小。 而從他們的公務員行測產品來看,推出兩個多月,使用者累計有效答題量已經超過了2235萬。
這些演算法和資料,從產品層面來說,體現在了猿題庫的兩個主要模組上:智慧練習和能力評估。
在智慧練習這一塊,猿題庫會從兩個角度考慮:1.誰在做題。 結合使用者之前做題的歷史資料,即時評估個人能力;2.題是哪些,根據全部有效使用者的海量做題資料,即時統計題目的相關資訊,包括每道題的答題時間、正確率、難度、易錯項、難度值等,結合考點和難度值的要求,選擇題目。
就拿類比試卷來說,猿題庫的做法並非是把題庫裡的題隨機抽取組合,而是結合遺傳基因演算法,有一個複雜的計算過程:系統先在題庫裡生成一百套題目,然後兩兩組合,新生成兩百套題目,再以考點與原來使用者練習的情況為標準,對題目進行打分, 把打分低的去除,保留一百套。 這樣做一百次之後,最後才會生成一套試卷提供給使用者。
從能力評估上來說,他們會根據使用者的歷史練習資料,計算出使用者對各個考點的掌握能力,然後通過與以往考試重點的匹配,映射到實際考試中,對使用者在實際可能取得的分數進行預測。 運營總監帥科稱,在今年公務員省考成績出來後,部分使用者回饋說,猿題庫的預測和他們實際取得的分數差異,在5分以內。
由於使用者對教育產品的付費意願很強,而且出於團隊的意願,猿題庫選擇的是按月訂閱的收費方式,司考題庫和行測題庫的定價都為每月25元,所有新使用者擁有3天全功能的免費體驗期。 李勇稱,公務員題庫推出兩個月,付費使用者約為5%,這已經不低。
「增值服務的方式老讓我想起SP,說是免費,但其實這也收費那也收費,這種方式太low。 所以我們寧願選擇付費訂閱的方式。 」
不過,使用者付費不是猿題庫設想的唯一盈利方式,既然把自己定義為大資料公司,李勇所想的仍然是資料的生意,他稱,猿題庫是個學習型產品,但是定位和教育測量有關,所以會利用所擁有的資料,嘗試和教育機構進行合作。
雖然針對不同的考試,猿題庫都會提供定制的功能,但是模型已經可以複用,邊際成本大大降低,所以他們將很快針對各類資格考試推出不同的產品,包括即將在6月份發佈的考研類題庫和一級建造師題庫,包括從業資格考試題庫也在計畫中。
看起來,他們已經對自己要走的路足夠清晰:這個30個人規模、絕大部分是技術研發人員的團隊,已經計畫要在今年下半年實現收支平衡。
(責任編輯:蒙遺善)