法律大資料的時代來了嗎?

來源:互聯網
上載者:User

大資料時代正使法律變得前所未有的強大,在當今數位時代,大資料極其重要,尤其對律師事務所而言,法律業務也許最終會靠資料驅動,那時我們可以通過一名律師從成千上萬潛在相關的案件中篩選資料的能力,判斷他或她是否是一名好的律師。

隨著海量資料的獲得,分析正變得更加重要。 對法律資訊進行驗證、組織甚至使法律資訊視覺化的新工具正在説明法律工作者掌握海量法院資訊,由於存儲變得更加便宜且處理器變得更加快速,這些工具中內置的智慧很可能成為未來數位法律搜索的關鍵區別。 本文整理者為天同CTO胡清平,i黑馬分享本文希望對大家有所説明。

文章一:大資料時代律師行業的三大變革

作者:中關村線上

面對新技術,法律專業人士通常是最保守的人群之一,但大資料時代,律師和律師事務所要想脫穎而出,卓爾不群,儘快採用大資料技術是不二之選。

2008年金融危機以來,律師行業經歷了長期的低潮,越來越多的企業客戶無法負擔高昂的律師費用,導致律所裁員不斷,規模日漸萎縮。 而那些行業領先的律所開始推崇「精益企業」,收費模式也從過去的固定費率調整為按需服務。

但是「精益律所」並非根本的解決方案,律師事務所還必須借助大資料大幅降低資訊處理成本,提高數位競爭力。 近日GigaOM專欄作者DerrickHarris撰文指出,律師事務所基於大資料進行流程優化時,需要重點考慮三個問題。

一、自動化造就「火眼金睛」

文檔檢索可能是大資料對法律工作影響最大的領域。 律所通常存儲海量的非結構化電子文檔,包括電子郵件、Office文檔、PDF文檔等等,從數以TB計的資料中檢索案件相關文檔簡直就是律師的噩夢,費時、費力而且準確性差。 通過大資料智慧分析軟體,律所能夠大大提高文檔檢索效率。 例如大資料創業公司Recommind開發的大資料軟體能通過機器學習演算法進行「預測編碼」,大大提高法律文檔的檢索效率。 另外一家值得關注的企業—PureDiscovery的語義分析技術也能大幅提高文檔檢索效率。

值得注意的是Recommind還在不斷開發新的產品Hypergraph(超級圖譜),例如説明律師發現人、話題、時間表、非結構化資料之間關聯關係的功能(編者按:類似圖譜分析)。 在這個領域Recommind面對的競爭對手包括Zylab、EMC和IBM。

二、一切皆可數位化

案件訴訟中會產生大量文檔,而這些文檔「蘊藏」的資料對後來的案件辯護和審理則具有很高的參考價值。

大資料創業公司Lex Machina 的目標客戶是智慧財產權律師,為他們提供決策支撐資料統計服務。 Lex machina將很多過去的較為模糊的定性資料都給量化了,例如「這位法官對被告很不利」、「這種索賠的案件通常都能贏」或「這位律師對此類技術的經驗值最高」等。 Lex Machina的資料分析的資料來源主要來自公開的PACER(聯邦法庭資料庫),PACER的資料一直在那,但是LexMachina是第一家通過機器學習和自然語言處理等技術從中「淘寶」的公司。

值得注意的是,LexMachina的前身是一個非盈利專案—斯坦福智慧財產權法律結算中心,公司還招募到了斯坦福大學的機器學習和自然語言處理專家Andrew Ng和ChristopherManning。 IEEE Spectrum上有一篇對LexMachina的報導非常精彩。

三、大資料時代應用的自助與創新

與其遙遙無期地坐等大資料廠商開發好用的律師工具,律師們需要自己動手,創造性地利用各種現成的大資料工具和資料來源。 例如律師可以使用類似ScraperWiki這樣的工具分析證人的Twitter連絡人網路和活動記錄。

律師還可以使用類似etcML這樣的免費工具(對應的付費服務如AlchemyAPI)分析各種文本,包括推文和電子郵件,來發現關鍵觀念或進行傾向性判斷。 零用import.io這樣的工具從網站抽取資料(例如房產價格歷史資料),並製作成圖表。

另外,律師還應當學習掌握目前比較流行的一些資料視覺化檢視。

文章二:機器人會偷走你的飯碗嗎——律師篇

譯者:丫丫丫

過去幾年,法律行業見證了科技創新的飛速發展,這一切都得益于電腦轉譯和理解書面檔的能力的增長。 現在許多律師事務所使用「電子取證」工具來從大量證據中搜尋感興趣的事實和數位。 事務所還擁有可以起草法律檔的軟體程式,耗時僅為人類的幾分之一。 這種自動化技術將把法律服務帶到廣大群眾中去。

設想一下你現在正面臨一場訴訟。 你新開的一家公司創造了一個十分受歡迎的小程式,而你的首要競爭對手「微小軟」國際公司正對你提起專利侵權訴訟。 如果「微小軟」公司獲勝,那麼你將要賠償數千萬美元。

於是你向公司內部的律師諮詢,他推薦你雇傭一位闊佬有限責任合夥公司的專利專家。 第二天,一群闊佬公司的律師浩浩蕩蕩進入你的公司,把你的所有選項一一列出。 與「微小軟」公司官司的辯護費用不菲——這還沒算給案子指派的律師的計時收費,你還需要雇傭專家證人和陪審團指定的專家,並支付他們的差旅費和訴訟費。 總的算起來你需要約500萬美元,但闊佬公司長老級別的資深合夥人錢袋先生向你保證說花這筆錢是值得的——他處理過很多這種案件,他一邊說一邊向你眨眼睛,他的直覺告訴他他會獲勝。

你的另一個選擇是和「微小軟」公司庭外和解。 你需要支付1000萬美元許可費,這筆錢不算少,但對你公司來說還是拿得出的——然後你可以繼續做你的生意。

你會怎麼辦?

做出一個抉擇並不容易。 在這個公司時代,法律業是少數幾個主要依賴人類經驗的地帶之一。 任何人在捲入一個標的額數百萬美元的案件前都會問這麼幾個基本問題——我獲勝的幾率有多大?我的律師有多棒?我該和解嗎?——這些問題都沒有一個確定的回答。 「法律界人士們都有一個文化傳統。 」密歇根州立大學法學院助理教授丹尼爾·卡茨(Daniel Katz)說道,他是致力於將經驗主義和人工智慧引入法律的先鋒法學研究者之一。 「人類有很多想當然的事情,人們傾向于認為法律知識只適用于人類,而資料、電腦和自動化設備則不適合于此。 」

卡茨正在研究他的「量化法律預測」。 在美國,每年都有成千上萬起專利案件被記錄在案。 因而很有可能「微小軟」公司起訴你的案子和一大堆其他案件有著相似之處。 如果你能夠仔細分析「微小軟」公司訴訟請求中的關鍵特徵,然後再瞧瞧這許許多多具有可比性的案件是如何進展的,那麼會怎樣?「 律師們就可以這樣對客戶們說,‘我覺得你有這麼點勝率——而這是電腦基於一萬件類似案件推斷出來的勝率。 ’」卡茨解釋道。

如今沒有一台機器能做到這點,但將來會有。 在上一章,我仔細審視了一種正蠶食著新聞業的技術——電腦在運用語言上愈發嫺熟,它們已經能完全靠自己寫故事。 而記者的活計簡直是小菜一碟;如果你想從事一個十分依賴于語言的工作,那麼財大氣粗的法律界可是個好去處。

在過去的幾年中,法律行業見證了科技創新的飛速發展,這一切都得益于電腦轉譯和理解書面檔的能力的增長。 現在許多律師事務所使用「電子取證」工具來從大量證據中搜尋感興趣的事實和數位。 事務所還擁有可以起草法律檔的軟體程式,耗時僅為人類的幾分之一。 一些馬上就要誕生的服務將能做更多的事——比如說商議合同條款,或者判斷你是否該起訴。

這種自動化技術將把法律服務帶到廣大群眾中去。 許多本應該雇用一名辯護律師來處理商務事宜或個人糾紛的人卻承擔不起這筆費用。 當你想和你的抵押放貸者作鬥爭、為創辦一家小公司而起草合同或想要靠打官司贏得孩子的撫養費時,就可以依靠電腦軟體。

雖然法律自動化對那些付不起錢請律師的人來說是一個福利,但這對於律師來說是個壞消息。 律師行業現在本來就不景氣,上法學院也不再是通向富翁之路的康莊大道。 因為軟體的存在使得更少的律師能做更多的工作,那麼對律師的價格和需求必然隨之下降。

「在我住的伊利諾斯州,你可以看到大片的閒置土地——因為你不再需要像以前那樣雇人力耕種玉米和大豆。 」伊利諾斯大學法學院教授拉裡·利博斯坦(Larry Ribstein)說道,他寫了好幾篇關於法律界資訊科技革命的論文。 「我現在看到這片大豆田,就會聯想到律師。 」

在我所寫的關於機器人和醫生的文章中,我主張初級護理醫師這個職業可能在機器人入侵中倖存下來,因為他們的職業靠的是必不可少的人類技能,例如引導面對面的談話之類的能力。 乍一看,法律行業看上去與之相似:法律由人類政客制定,由人類當局施行。 當發生爭論時,由人類法官和陪審團來裁決。 法律世界的方方面面——從牽涉到合同和訴訟的專業語言,到複雜的分析推論,還有對法庭書記員和法官們爛熟于心的判例的信賴——都來自于我們稱之為「律師」的那些怪物的前額葉。

如果你去看看大多數律師每天干的那些活,你會發現其中有許多部分都可以由機器來做。 語言、複雜邏輯的處理,對涉及多變數情形的預測——電腦在這些事上可拿手多了。

想想法律工作中最死板的那部分:起草商業合同。 在一名律師的職業生涯中,他也許要起草數以千計份合同,其中的許多都包含著大量重複的內容。 現在,幾家法律科技公司寫出了可以自動生成這些文檔的程式。 這些軟體的工作原理很像TurboTax報稅軟體,問你一系列的問題,之後運用分支邏輯深入到特定領域。 馬特·凱斯納(Matt Kesner)是矽谷一家具有開創性意義的法律事務所——芬維克-韋斯特(Fenwick & West)事務所的首席資訊官,他告訴我文檔生成程式幫客戶節省了時間和金錢。 去年,該律師事務所研發了一套可以自動產生合併案所需文檔的系統。 「它將我們以前平均要花20到40小時計費時間的工作減少到了幾小時,」凱斯納說道,「就算那些需要很多文檔的案子,我們也能把起草檔案的時間從幾天乃至幾周縮減到幾小時。 」

電子取證軟體的意義也是革命性的。 這些系統可以挖掘數量巨大的材料(例如一樁民事訴訟中的所有電子郵件往來),從中找出哪怕是一丁點的證據。 最簡單的軟體只是搜索特定的關鍵字,但是更複雜的系統可以檢測那些律師也許會感興趣的地方。 曾經新手律師頭一年做副手時整天都在幹這活;現在電腦做得更快,成本更低,卻和人類做得一樣好。

現在,人類律師有一樣優勢:法律界對自動化一直抱有懷疑,而且它在某些方面完全不適用。 為了建立他的法律預測系統,丹尼爾·卡茨需要大量的法律檔。 但是這樣的資料庫並不容易得到。 法庭會發佈書面判決,但是其它資料——比如立案書和動議——都保存在諸如聯邦法院的法院電子記錄公眾訪問系統(PACER)這樣的資料庫中,想要流覽就得交費。 直到這些資訊更容易獲取之前,人類律師還能再分杯羹。

但就像規定和條例不會永遠保護人類藥劑師一樣,律師在今天這些尚有瑕疵的資料庫和軟體的壓力之下也不應感到有多麼安全。 卡茨和其它研究者正在研究提取和解讀歷史資料的方法——他們建立了一個名為RECAP的專案,其目標是建成一個PACER的免費鏡像。 在法律的某些特定領域,資料分析已經廣泛應用。 2008年,斯坦福大學的一組律師和技術人員建立了智慧財產權訴訟資訊交換中心(Intellectual Property Litigation Clearinghouse),一項追蹤了10萬多件專利與商標訴訟案的專案。 斯坦福大學去年將它分拆開來,建立了獨立公司「法律機器」(Lex Machina),該資料庫是目前為止對專利權案件最全面的匯總,並且已經説明推翻了一些專利法領域的基本信條。 多年來,專利法律師們相信加利福尼亞州北部地方的法院更傾向于被告,而德克薩斯州東部地區則更偏愛原告,這種想法讓他們習慣了挑選對自己有利的法院進行審理。 「但是當我們查閱加州北部法院記錄時,發現原告獲勝的時候更多——完全和我們已知的常識相反,」法律機器的CEO約書亞·沃克(JoshuaWalker)說道。

像這樣的故事——資料分析顯示出人類直覺錯誤的例子——表現出了電腦分析的威力。 「法律機器」專案尚不成熟,現在還沒人用資料庫來預測某個特定的專利案的結果。 但你仍可以看出這樣一套系統在你和微小軟的訴訟中會製造多大的便利。 至少,你可以用它來挑選你的律師,並決定是否和解。

沃克認為像「法律機器」這樣的事物是設計來補充人類的智慧,而不是取代人類的。 他說,隨著人手越來越多,這個資料庫會讓律師對自己的工作更在行。 這可能是真的,但是,同樣毋庸置疑的是,這些系統可以系統地説明客戶決定該不該起訴,以及請哪家法律機構,還有在哪提交案件,這將減少律師的用途。 我交談過的所有法律研究者都沒反對過這點,但有些人說從長遠看來,自動化可以讓當律師更有趣。 大部分電腦能做的事都是律師痛恨做的。 就像丹尼爾·卡茨所見,律師們可以將這個職業中最糟的那部分外包給機器,這樣他們就可以用更多的時間來處理客戶關係,並且確保電腦幹了該幹的活。

「你得讓這條虛擬的流水線動起來——你就是揮舞著指揮棒的指揮大師,指揮著整個流程運轉,」卡茨說。 自動化不僅可以讓律師們擺脫苦差事,還可以讓他們能為更多客戶服務。 還有,以前你只能為幾個花了大價錢的客戶服務,而現在你可以通過機器服務成千上萬的人,説明那些現在無法獲得法律服務的人。

如果自動化能花更少的錢,給更多的人帶來法律服務,同時還能精減人類律師隊伍,我覺得大多數讀者都會認為這是一個多贏的選擇。 而從長遠來看,這很可能實現。 問題在於,這一步可能十分艱難——多家事務所會倒閉,一大群菜鳥律師會找不到工作,一個龐大產業的經濟前景就此衰敗。

但是,就我現在寫到的所有職業而言,法律業的前景看上去其實是相對最光明的。 的確,律師們會吃點苦頭,但是我們剩下這些人會從中獲益。 「法律的存在並不是為律師提供飯碗的,」卡茨說道,「這不是它的社會功能。 它的存在是為人們解決問題的——而如果我們可以用更少的律師服務更多的人,我不認為這是一條不合理的路。 」

在接下來我要解釋的是,我發現在科學界也有相似的趨勢。 也許不久以後電腦就會揭開一些自然界的基本奧秘。 它們也許在逐步取代人類,我們是否應該小心這點呢?

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.