Glean: 你所需要的企業內部 AI / LLM 搜尋引擎與智慧大腦

ShengFen
14 min readJul 24, 2023

--

Glean: 企業內部 AI 搜尋引擎與智慧大腦

隨著 ChatGPT 和 LLM 的興起,新創和企業開始關注如何透過 LLM 來提升員工生產力和開始頭腦風暴思考內部 Chatbot使用場景。最常聽到大家提到的一點是 — — 好想要有一個可以回答公司內部問題的超級 Wiki Chatbot!如果你也有想過這句話,或許你可以嘗試看看 Glean(或是看看我的這邊介紹文)。

企業內部搜尋的普遍痛點:花了好多時間找內部資料

大家在上班的時候普遍來說,應該都有體會過一個情境,那就是需要耗時許久,且需要翻遍所有公司有採用的各種軟體工具,只為了查到一個文件、一份相關資訊或一個聯絡窗口。特別是對於那些身處在一定規模等級以上的企業員工,應該會是特別有感的事情。根據一份N年前的麥肯錫報告,企業員工平均每天花 1.8 小時在搜尋和聚集資料。而這個痛點,甚至也出現在以「資料搜尋功能」起家與聞名的 Google 內部當中,創辦人 Arvind Jain 擁有在 Google 擔任軟體工程師超過十年的經驗,並在 2014 年共同創辦了一家雲端資料管理公司 Rubrik。在這兩個經驗當中,Arvind 發現到阻擋員工生產力的最大要素是 — — 「員工無法輕易找到他們所需的資料」。因此 Arvind 選擇在 2019 年創辦了 Glean ,致力於打造企業內部搜尋引擎。

細數以「搜尋功能」為主要價值的公司,大家第一家會想到的是 Google 這個針對網路公開資料搜索的龍頭,而其他主打提供搜尋功能公司如 Algolia、Elastic、Lucidworks 或是 Coveo 鎖定的場景並非是提供給企業內部員工使用的場景,而是提供 Search-as-a-Service API 給企業在其 Consumer-facing 的網站上或 App 內的搜尋功能。舉例來說,許多電商品牌上的官網搜尋功能是選擇串接 Algolia 的服務,主要原因是一般品牌端無法建立內部的工程團隊從頭打造一個好用的搜索服務,因此消費者在電商網站上使用搜尋功能的背後用到的技術其實是來自於 Algolia。

企業內部搜尋引擎與一般公開資料搜尋引擎差在哪?

那為什麼沒人在做企業內部搜索引擎呢?做一個企業內部搜索引擎產品的困難點主要來自於什麼?

事實上,做一個企業內部搜尋引擎和 Google 在做的公開資料搜尋產品,在產品特性上有諸多不同,而這些不同也正是 Glean 需要去解決的困難點:

困難點一:去哪裡獲取企業資料?

企業內部資料分散性問題和不易獲取會是主要問題,企業內部有使用的軟體工具百百種,也是導致企業內部資料分散性的原因,且企業的資料來源大部分都是閉源(Closed-source),不像是公開網頁資料可「公開爬取」,也較沒有一定標準化的方式可以去爬取資料,使得若要做出一個類似統一數據的訪問介面變的更加困難。

困難點二:怎樣是好的搜尋排序結果?

Google 當前的精準和個人化的搜尋結果來自於大量的用戶針對搜尋結果點擊的行為資料,因而可以優化呈現的搜尋結果精準度。然而,時常員工於企業內部的搜索行為一來是不夠「龐大」,甚至也需要其演算法需要在初期使用時便能非常精準的搜尋到正確的資料,二來是員工的點擊行為資料很常過時,因為員工需要獲取到的資訊不只是要精準,而是要最新、最即時、最正確。因此如何針對企業內部來設計演算法來排序搜尋結果,勢必要用的方法會需要不同。

困難點三:誰可以/不可以搜尋到哪些資料?

資料取用、權限管理及資安問題:企業員工有分職等、部門、等權限層級,因此當作為一個企業內部搜索引擎呈現出搜索結果時,特別需要一個控制系統,來針對不同部門、職級的員工進行調整搜尋結果。而在取用企業內部資料時一定會涉及敏感性機密資料,所以整套系統也特別需要在合規及資安面上特別建立起公信力。

針對第一個困難點,隨著軟體公司在 API 體系的成熟,讓原先鎖在各個應用內的資料可以透過 API 的方式被整合和取用,讓資料整合逐漸成為可以被解決的問題。如今 Glean 已成功串接超過 100+ 個軟體應用,軟體類別基本涵蓋了新創和Enterprise等級企業在各個環節會使用到的軟體工具,除了支援 Google Workspace 及 Microsoft 的 Outlook 及 One Drive 以外,像是:行事曆、信件/溝通工具、檔案文件知識庫、軟體工程和分析工具、人資工具、公司內網系統、員工登入系統/SSO、專案管理、員工教育訓練、銷售及行銷及客服支援等。

Search & AI Assistant Product Demo (Source: Glean)

針對第二及第三個困難點,Glean 發展出基於 Enterprise Graph 的 AI 來將員工的角色、工作型態、職能、還有特定項目列入變數內,並根據客戶的數據來訓練其 AI 系統來學習公司、產業的慣用語、概念、組織名稱和縮寫詞等,讓員工在搜尋時便透過各式自然語也能查詢到他最需要且符合其權限的資料。員工目前可以直接透過開啟網頁應用、新分頁、Sidebar 搜尋、自然搜尋或是直接透過 Slack Command 執行這些搜尋操作。

Work Hub Product Demo (Source: Glean)

客戶若要選擇採用 Glean,不需要數月的導入時間,該平台宣稱僅需要少於兩個小時的初步設定,也不需要複雜的軟體工程和手動微調導入(Manual fine-tuning for implementation)。目前 Glean 的客戶多為剛上市不久的公司(多半為位於 2021 年後 IPO 的)如 Samsara($15.3b)、Okta($11.6b)、Confluent($10.8b)、Duolingo($6.4b)、Amplitude($1.6b) 或在快速成長階段的獨角獸新創公司如 Databricks、 Plaid、Vanta、Grammarly、Aurora、Outreach、Greenhouse、Coda。

無法利用 PLG 進行市場進入策略的 Glean

Glean 的產品牽涉到企業資料、資安、員工權限管理的產品,自然無法簡單透過 Product-led Growth 的方式來讓客戶採用,甚至市面上較少見同款訴求的產品類型,讓 Glean 在早期有可能需要花非常多的時間去教育市場。

在公司成立的頭兩年時,Arwind 是唯一的銷售人員,前面的 15–20 家企業客戶都是他簽下的客戶。身為創辦人的首要任務便是驗證市場需求,而只有作為業務,才能第一手了解買家(像是 :Chief Information Officer)對於產品的需求痛點、購買意願和決策過程。直到已經成立第三年時 Arvind 才招募了第一位業務,並在確認 PMF 之後,才開始建立起銷售團隊進行規模化的銷售。

所以研究 Glean 時,我覺得最讓我好奇的三個問題是 — — 1. 如何打造其 MVP 並鎖定為期理想客群?2. 如何對客戶創造出 Leap of Faith 成功讓他們願意購買 Glean ?3. 如何確認此產品有達到 Product-Market Fit」?

  1. 如何在早期打造其 MVP 並鎖定客群?: Arvind 在 Podcast 中提到,Glean 產品的第一個使用者正是他們自己,而且他們內部的每名員工每日都在使用 Glean,不管是軟體工程、客戶支持、行銷人員、業務銷售、客戶經理都會使用到,因此深刻了解怎麼樣的資訊在各個部門上是最需要獲取的,以及員工日常工作中會遇到的資料搜索相關痛點為何?當 Glean 團隊規模成長到 50 人時,基本上已經無法離開 Glean。受惠於這些經驗,也讓 Glean 更好地可以描繪出他們早期想鎖定的客戶類型 — — 快速成長需求的軟體科技新創公司。
  2. 如何對客戶創造出 Leap of Faith 成功讓他們願意購買 Glean ?:如同創辦人 Arvind 所說,他一開始在銷售產品時,最常見得到的客戶反饋是 — — 「對公司來說,這是一個全新類型的產品,跟過去購買的軟體產品都不一樣,不知道購買產品的效益該如何衡量?」對於客戶來說,他們很難評斷 Glean 的價值,也因此 Arvind 對應此問題的方式是 — — 利用量化方式的方式呈現出客戶面臨的痛點,像是呈現出企業員工平均每天花(浪費)上多少小時在搜索企業內部資料,相對應地其價值便是 Glean 能為此痛點解決多少小時的員工搜索時間,特別是在那些高薪資水準的崗位上,像是軟體工程團隊、業務團隊、產品管理等崗位。假設每次搜索可以節省員工將近 30 分鐘的時間,那兩千員工規模的公司,在一天十次的使用頻率下,將節省公司一天將近六十萬分鐘的時間。Glean 也選擇採用「Free trial」的模式,讓其產品能在一段時間內能被公司完善體驗到其產品價值,降低適用的阻力門檻。
  3. 如何證明 Glean 已否有達到 Product-Market Fit:雖然說 Glean 的銷售模式仍是偏向 Top Down,但真正重要的仍是公司員工是否有在實際使用該產品,因此 Product Market Fit 的關鍵衡量指標之一是需要觀察導入後,員工對此產品的黏著度和使用率究竟為何?通常客戶的採用情境是公司發布一則內部公告給員工說當前有此工具可使用。可想而知,一開始僅有少部分員工會嚐鮮使用,而此時 Glean 能善用「生產力工具」常見的散播方式 — — 「口耳相傳」的推薦分享方式,來增加該工具在公司內部的滲透率。此時,Glean 能獲取更多用戶使用數據,包含哪些部門、層級、產業的員工會巨量的使用到 Glean 的服務,各類型員工的使用頻率為何?究竟是一天十次還是一週三次,這也將巨幅影響企業在適用期過後的採購意願

從企業搜尋引擎 > 企業智能中心 > 企業 CoPilot 工具

Glean 從企業內部搜尋功能作為出發,但實際上其所佔據的戰略位子非常好,因為 Glean 本質上來說是企業內部所有資料的一種 Aggregator(聚合器),對於生產力、知識管理需求高的產業來說會是非常強的智慧知識管理中心(Enterprise Intelligence)。

Glean Knowledge Management Product Demo

LLM 技術在泛用使用場景和語境辨析比一般關鍵字搜索更強,這也讓 Glean 於 2023 年 5 月,宣布將整合 LLM 功能,提供三項新的功能,包含 AI Answer、Expert Detection 和 In-Context Recommendation。

針對 AI Answer 部分,Glean 將如何解決 LLM 著名的胡言亂語(Hallucination)問題?Arwind 表示透過其產出答案的過程將會是系統先透過 Enterprise Graph 等方式集成搜尋結果,再利用 LLM 進行整合提供最終建議答案。而 In-Context Recommendation 功能將根據用戶提供的資料,自動生成補充性內容和前後文補充,將加速整體搜尋和資料探索和初步文件撰寫的體驗,這讓我想起了 Microsoft 365 Copliot 的強大 Demo 影片。Glean 和許多僅作為薄薄一層 LLM 的生產力工具相比,已有過去三年所累積起來的企業員工在軟體和搜尋上的行為動作和在各產業累積上所奠基出來的產業理解能力,將會是其在與新進玩家競爭上的優勢。

Glean 未來的天花板?

其產品潛力讓 Glean 直到今日已成功募資了將近 1.5 億美金也讓 Sequoia Capital 的 Partner Sonya Huang, 於 2022 年主動找上 Glean 領投其 Series C 將近一億美元的募資,且給予其超過十億美金的估值, 據稱是前一輪估值的三倍。其投資人陣容星光熠熠,除了 Sequoia Capital 以外,還有眾多 Tier1 的創投基金包含 Kleiner Perkins, General Catalyst 和 Lightspeed Venture Partners。

Glean 初期鎖定的類型的客戶內部工具使用範圍較傾向靈活、彈性、雲端化、協作,願意使用新型態的生產力工具,較不願意使用傳統的 Microsoft。翻開 Glean 的客戶組合,客戶數量從 2021 年的 40 家左右的客戶成長至 2022 年的 70 家左右,但大多仍是員工人數規模在五百至兩千人左右的 Late-stage 新創,少數是剛 IPO 三年內的軟體公司。

儘管作為一家當前估值為獨角獸的公司,野心不可能不看向 Fortune 50 的公司,畢竟這是一群最肥的羊,但此客群大多已深度採用 Microsoft 365 的生產力生態系,想要侵蝕到 Microsoft 的程度,將會是非常有挑戰性的。據稱 Microsoft 客戶願意支付超過 40% 的議價來使用具備 AI 協作的能力 Microsoft 365 CoPilot,以此可以證明企業對於生產力的追求是很願意支付額外的成本和預算。

根據 Crunchbase 統計,目前在美國約有近 700 家獨角獸公司與 180 家估值落在 5 億至 10 億估值的新創公司,因此大約至少有 900 家後期新創可以算是落入其 ideal customer profile 的範圍,以當前 Glean 的客戶數量規模,約還有 10x 的成長空間,此估算還不算入團隊規模更小的新創公司。Glean 能不能邁向下一哩路的關鍵指標是 — — 有沒有辦法成為這 900 家公司在「非 Microsoft 體系的智慧搜尋和生產力 Co-Pilot 方案」首要選擇?

-

如果你喜歡我的內容,歡迎訂閱我的電子報

-

Reference

  1. Glean Official Website
  2. [Podcast] ($155M raised) Glean’s Founder, Arvind Jain: How to close enterprise deals from day one: https://www.listennotes.com/podcasts/sit-down-startup/155m-raised-gleans-founder-W-AOuFVEtGU/
  3. [Podcast] How Glean found product-market fit: Arvind Jain on enterprise search and AI: https://www.listennotes.com/podcasts/startup-field/how-glean-found-product-SLB7lJi_f2M/
  4. https://www.globenewswire.com/news-release/2022/05/18/2446150/0/en/Glean-Raises-100M-Series-C-At-1B-Valuation-To-Deliver-A-Powerful-Unified-Search-Experience-For-Companies-Across-Their-SaaS-Apps.html
  5. https://www.forbes.com/sites/kenrickcai/2021/09/15/glean-startup-emerges-from-stealth-enterprise-search-assistant/
  6. https://techcrunch.com/2022/05/18/glean-aims-to-help-employees-surface-info-across-sprawling-enterprise-systems/
  7. https://get.glean.com/rs/626-JWX-444/images/Glean_Enterprise_Search_Buyer's_Guide.pdf
  8. https://www.glean.com/blog/search-launch-announcement
  9. https://venturebeat.com/ai/glean-launches-new-generative-ai-capabilities-to-enhance-search-and-discovery-across-organizations/

--

--