看標題可能會一頭霧水,但這篇絕對不是「標題殺人」的文章,我們說的是人工智慧對於我們營運虛擬主機在「成本」上的挑戰。
圖片來源:tesla.com
電動車龍頭特斯拉(Tesla)透過其神經網絡人工智慧發展其自動駕駛,其學習方式就是不斷參考特斯拉車主的駕駛方式,那現在最流行大型語言模型(LLM)人工智慧是如何進行學習呢?「上網」是其中一個手段,任何網站都是人工智慧的「學習對像」(所以說那些LLM服務會輸出疑似抄襲內容其實一點都不稀奇),當中少不免有我們的客戶網站。
您可能會問,這些行為,像Google或者Bing的搜尋引擎,不是一直在做嗎?這個牽涉都兩個問題:1) 一般搜尋引擎只會下載網站的文字內容或者縮圖,LLM會比較多下載媒體類檔案,佔用的頻寬是以倍數計的差異。2) 大部份(可能是全部)的LLM都是從海外連線到主機瀏覽客戶網站內容,而海外頻寬佔經營虛擬主機成本佔非常大的一塊,而中國大陸的頻寬(如CN2)又比一般海外頻寬成本貴好幾倍,某種意義上,是我們給頻寬的錢,然後給LLM機械人「餵食」。
我們在去年進行過測試,嘗試用某些方法限制LLM機械人下載網速(其實部份LLM下載機械人會看 robots.txt ,所以網站管理者其實有權拒絕「被學習」,如管理者知道有這回事的話),設定套用後,海外(包括中國大陸)頻寬至少下跌三成(上圖五月中下降就是套用LLM網速限制),這部份頻寬成本可以佔公司支出不少的比例。到現在為止,為保障客戶網站瀏覽體驗,我們仍然有適量限制LLM機械人下載網速作為折衷方案。
發佈留言