大家好,今天繼續聊聊科技圈發生的那些事。
一、高德獲賠
據北京市朝陽法院的官方公眾號訊息,涉導航電子地圖“擁堵延時指數”資料權益不正當競爭糾紛案在北京市朝陽區人民法院公開審理。

朝陽法院一審認定被告某資訊科技股份有限公司構成不正當競爭,判決該公司停止侵權、消除影響,並賠償原告北京某科技有限公司、某軟體有限公司各項損失共計 1250 萬元。
事情是這樣的,某資訊科技公司在未經授權的情況下非法抓取了高德地圖“擁堵延時指數”的資料。這個資料代表居民出行實際時間與自由流速度狀態下的時間平均比值。簡單來說,就是看堵不堵車的。

該公司抓取了擁堵延時指數後,將抓取的資料儲存在某金融終端軟體中,以商業目的向付費使用者傳播,以此牟取經濟利益。
朝陽法院經審理認為:
這種行為違背了資料領域中公認的商業道德和誠實信用原則,損害了原告公司的合法權益及消費者利益,破壞了資料領域中的市場競爭秩序,構成不正當競爭。
後來據相關媒體報道得知:
-
原告為北京高德雲圖科技有限公司、高德軟體有限公司
-
被告為萬得資訊科技股份有限公司,是一家知名金融軟體服務企業,總部位於上海陸家嘴金融中心。
二、快手可靈
可靈(Kling)是一款影片生成模型。最近在網上的熱度很高,效果很強!
提示詞:一個男人騎著馬在戈壁沙漠飛奔,背後美麗的夕陽,電影級別畫面
相信說到影片生成模型,咱們最先想到的應該還是 Sora。Sora 的小狗、都市女性在網上瘋傳了一段時間,可大家卻一直沒法真實得體驗到。這次可靈一來就是大暴擊,沒有吊人胃口的 demo 和預釋出內容,直接就是開放測試!
提示詞:一個戴眼鏡的中國男孩在快餐店內閉眼享受美味的芝士漢堡
不難推測,Sora 用的訓練集大多是歐美那邊的,而快手肯定是就近取材了。可以發現根據訓練集的不同,可靈生成出來的影片相較於 Sora,明顯更符合咱國人的胃口。比如車牌的底色是藍色,與國內相符;人物的長相符合國人特點;生成的影片如果和吃飯相關,會使用筷子。
提示詞:一箇中國男人坐在桌前,用筷子吃麵條
此外,可靈還有一個影片續寫的功能。給出一段影片,它可以幫你往後【+5s】,續寫一小段。經過實測,最多可以續寫三分鐘左右。
續寫x1: 女孩抬起手觸碰到帽簷續寫x2: 女孩放下手,看向遠方
怎麼樣,這個效果確實還不錯吧!可靈採用了 3D 時空聯合注意力機制,使得新生成的片段並沒有像 Sora 一樣出現一些反物理現象,能符合運動規律。
網友評論道,可靈生成的影片的確不像 Sora 那樣有很高階的濾鏡感,一眼給人很驚豔的感覺,但生成的影片明顯更貼近生活,真實了很多。
目前可靈主打的功能就是圖/文生影片,以及影片續寫。需要注意的是,這個模型現在申請使用的人比較多,可能需要排隊。感興趣的小夥伴可以耐心等待一下。
體驗地址:
https://kling.kuaishou.com/
三、Florence-2
前不久,微軟開源了 Florence-2。這是一款適用於各種計算機視覺和視覺語言任務的模型。
我們能接觸到的視覺方面的大模型在遷移學習方面表現出色,但通常專注於某一項任務,很難透過給出簡單的指令完成不一樣的任務。Florence-2 這款模型最厲害的點就在於,它可以透過 task prompt 給出任務指令,包括但不限於字幕、物體檢測、文字識別等。

模型採用自動影像註釋和模型完善的迭代策略,其中包括 1.26 億張影像上的 54 億個綜合視覺註釋。因此,Florence-2可以執行多功能綜合視覺任務。
比如在下面這張圖上我們給出的prompt選擇了Object Detection 目標檢測,可以看到,模型檢測到了圖上的各個部分。

目前,模型的 prompt task 可輸入,但也做了選擇框,裡面基本涵蓋了大部分主流的計算機視覺任務。

模型內容還在持續更新,感興趣的小夥伴可以持續關注一下。
專案地址:
https://github.com/retkowsky/florence-2
線上體驗地址:
https://huggingface.co/spaces/gokaygokay/Florence-2
好了,本期的內容就是這麼多,我們下期再見!

·················END·················