3個令人興奮的AI專案,已開源!

大家好,今天繼續聊聊科技圈發生的那些事。

一、manga-image-translator

當你作為一名資深二次元,跑遍了論壇,求遍了群友,終於,找到了一份期待已久的漫畫資源。
嗯,畫面和之前看到的切片差不多,可就是哪不對..
生肉?!可沒人說看個漫畫還得精通語言啊!看不懂,咋辦?
於是,manga-image-translator來了。
正如其名,manga 即日語的漫畫, manga-image-translator 是一款開源的影像翻譯器,上傳圖片,它能夠識別影像中的文字部分,並將其翻譯成你想要的語種。
OCR(Optical Character Recognition),光學字元識別技術。基於這項技術, manga-image-translator 可以透過亮-暗檢測的模式,精準的提取出圖片中的文字,將其轉換成可處理的資料。
manga-image-translator 接入了很多翻譯器,將OCR提取出的文字進行翻譯。
此外,manga-image-translator 還有去除文字氣泡裡面內容的功能,方便後續進行編輯美化。當然,在進行文字去除後,manga-image-translator 還會對餘下的氣泡部分進行修復,保證了檢視的美觀和完整。
去除氣泡內文字
專案地址:
https://github.com/zyddnys/manga-image-translator
目前專案已經開源,支援命令列執行Web伺服器執行兩種模式。感興趣的小夥伴可以自己試一試。
想必,開發團隊中難免少不了幾個紳士吧。

二、screenshot-to-code

一款將螢幕截圖轉換成程式碼的開源工具。
透過擷取螢幕影像,screen-to-shot 工具可以識別出程式碼的頁面佈局,生成HTML、CSS、Javascript 等常用的程式碼,同時還能預覽程式碼實現的效果。
透過這個功能,似乎就像是 screen-to-shot 幫我們戴上一副透視眼鏡。僅僅根據截圖,我們就能透過影像,直接看到背後的程式碼結構。當然,這背後的工作仍然要交給 AI 。
我們嘗試將 Taylor Swift 的 Instagram 個人主頁截圖下來,並將其上傳給 screen-to-shot。
可以看到, screen-to-shot 在很短的時間內就生成了新程式碼,將 Taylor  的主頁以很高的還原度“複製”了下來。
對於 NYTimes 的新聞, screenshot-to-code 也有不錯的表現。
單看這兩個示例,我們可以發現,拋開選用的影像,只談頁面佈局的話,說不上是一模一樣,但 screen-to-shot 至少能給出相似且舒服的程式碼,實現類似的佈局效果。
在專案的主頁上,作者團隊宣告使用了以下的AI大模型:
  • GPT4-Vision
  • Claude 3 Sonnet
  • DALL-E
工具主要使用 GPT4-Vision 生成程式碼,而 Claude 3 Sonnet 用於輔助(在某些輸入情況下,它比 GPT4-Vision 效能更好),並使用 DALL-E 生成影像。
目前 screenshot-to-code 有兩種使用方式。一種是在作者團隊的網站上線上使用,需要付費。
地址:https://screenshottocode.com
另一種是本地部署。
專案地址:
https://github.com/abi/screenshot-to-code
除了上傳截圖生成程式碼外,工具同樣支援輸入網頁URL線上獲取截圖。專案已開源,可以自己部署進行體驗。

三、OMG

國產團隊開發的專案。簡單來說,就是可以支援換臉生成。
OMG 支援 civitai.com 上的角色和風格 LoRA 。它還可以與 InstantID 組合用於多個 ID ,每個 ID 使用一個影像。
我們可以來看看作者團隊給出的四種示例。

OMG + LoRA

LoRA 是 Stable Diffusion 模型的外掛網路,在 SD 模型的基礎上進行精細的微調。

OMG + InstantID

InstantID 的特點,就是可以在保持高保真度的同時,支援各種不同風格的影像生成。它能夠根據一張人臉影像,生成多種風格的影像。

OMG + ControlNet

同樣是 SD 模型的外掛之一。可以輸入一些調節影像指導影像的生成,在幾種不同的方法下控制圖片的佈局,例如邊緣圖、深度圖、分割圖、法線圖等等。
姿勢示例
邊緣圖示例
深度圖示例

OMG + style LoRAs

更換了幾種不同的風格。
style LoRAs示例
專案地址:
https://github.com/kongzhecn/omg
專案已經開源,可以根據自己的需要,自由選擇想要的方法進行體驗。

·················END·················


相關文章