LMArena AI

前身為lmsys.org，是一個專注于眾包AI基準(zhǔn)測試的開放平臺，用戶可以在此平臺上免費與AI聊天并進(jìn)行投票，比較和測試不同的AI聊天機器人。

#Ai工具箱 #Ai平臺模型

LMArena AI簡介

LMArena ai，前身為lmsys.org，一個專注于眾包AI基準(zhǔn)測試的AI模型評估平臺，由加州大學(xué)伯克利分校SkyLab和LMSYS研究團(tuán)隊打造。類似 V0 或者 Bolt 的平臺，區(qū)別是你輸入一個需求后會有兩個模型給出代碼并且會把前端頁面渲染出來你去打分。用戶可以在此平臺上免費與AI聊天并進(jìn)行投票，比較和測試不同的AI聊天機器人。

LMArena AI功能特征.webp

LMArena AI功能特征：

盲測模式：用戶可以對兩個匿名AI模型提出問題，然后選擇最佳回復(fù)，確保評估公平性。
匿名對戰(zhàn)：用戶可以在平臺上與多個匿名的AI聊天機器人進(jìn)行互動，提出問題并獲得不同機器人的回答。這種方式允許用戶在不知曉模型身份的情況下進(jìn)行比較，從而減少偏見。
投票系統(tǒng)：用戶可以對不同AI的回答進(jìn)行投票，幫助平臺收集數(shù)據(jù)以評估各個模型的性能。這種眾包的方式使得評估結(jié)果更加客觀和可靠。
風(fēng)格控制：評估模型在遵循用戶指令和特定風(fēng)格生成內(nèi)容方面的能力。
排行榜：LMArena AI提供了一個實時更新的排行榜，展示不同AI模型的表現(xiàn)。用戶可以查看哪些模型在特定任務(wù)中表現(xiàn)最佳，幫助他們選擇合適的工具或服務(wù)。
WebDev Arena：該平臺還擴展了一個名為WebDev Arena的功能，用戶可以在這里輸入需求，系統(tǒng)會生成兩個不同的前端頁面供用戶評分。這為開發(fā)者提供了一個測試和比較不同設(shè)計的機會。

LMArena AI使用方法.jpg

LMArena AI還支持多模態(tài)功能，用戶可以在首次提問時上傳圖像，以解鎖多模態(tài)對戰(zhàn)。這意味著用戶不僅可以與文本模型互動，還可以通過圖像與AI進(jìn)行交流，增強了平臺的互動性和實用性。此外，LMArena AI收集了超過100萬個用戶投票數(shù)據(jù)，以計算100多個模型的Elo排行榜，用戶可以查看誰是當(dāng)前的LLM冠軍。

LMArena AI使用方法：