广州中央空调回收,二手中央空调回收,旧空调回收,制冷设备回收,冷气机组回收公司-广州益夫制冷设备回收公司

觸屏版 您好,歡迎瀏覽廣州中央空調回收,二手中央空調回收,舊空調回收,制冷設備回收,冷氣機組回收公司-廣州益夫制冷設備回收公司
廣州中央空調回收,二手中央空調回收,舊空調回收,制冷設備回收,冷氣機組回收公司,冷水機組回收,二手空調回收

產品中心

當前的位置:首頁 > 新聞動態
廣州制冷設備回收公司:280萬大模型中文開發者拿到最后一塊拼圖
發布時間:2025-05-30 05:50

2023年5月,微軟CEO納德拉拋出一個驚人數字,未來全球的開發者數量即將達到10億。

那時候Meta的Llama早已開源4個月,但一些中國的開發者顯示,從小以英文語料喂養起來的Llama,對中文天下并不友好。

這將來的“10億”開發者里會有多少中文開發者,這個問題難以推測,但至少早已有755萬人了。

圖源備注:圖片由AI生成,圖片授權服務商Midjourney

755萬人,這是2023年在GitHub上注冊的我國程序員數量,當今的程序員一定會是將來大模型的第一批開發者。

大部分人已經是了。

在浙江省電力設計院工作的陶佳,嘗試用一個開源的大模型來做基于私有知識庫的檢索問答類應用。他所面對的場景很突出,經常需要從幾十萬甚至上百萬字的文檔中查找內容。陶佳的專注是電力系統控制優化,里面有一些混入了傳統數學方法和AI方法的領域,因此對AI有基本認識,也從去年底就一直在關注著這波大模型的浪潮。

他試了幾款,試下來通義千問是最好的。“確切,而且‘手感’很好,沒有那些獨特古怪的bug”,他說。

要做的事也很簡單。有一些基本的軟硬件基礎后,在家里買個服務器、扔三四塊顯卡上去,下載通義千問、讓它在服務器上運行,再搞個FRP反向代理,從阿里云上買最便宜的30多塊錢一個多月的服務就行,這樣就能經過外網訪問家里的服務器,在單位里也能用通義千問做實驗。

當一個開源生態開始成型,這樣的開發者也進一步變多。

開始閉環的開源生態

陶佳對大模型最深處的祈盼來自一個終極問題:人類能否成為上帝?

美國的將來學家庫茲韋爾在2023年早已提出過這種沒準性。庫茲韋爾的想象里,人類到2030年將抑或成為半機器人。通過在腦中植入納米機器人,人類將可能干脆接入互聯網,智力將變得更高,并且將擁有幽默、音樂和愛等歡愉的天賦和能力。人類將成為像上帝相仿的完美存在。

那一年OpenAI剛才建立,但8年前庫茲韋爾的設想放到目前依舊有同樣的地方,只但是當下看起來好像在一個機器人(Agent)中添加意識和人性,這條路好像更近點——也就是AGI。

但哪怕技術是爆炸、是躍遷式的,正在離AGI還很遠。如若說AGI會再造一個新的天下,那現時人類對大模型的期望,依然是在現實基礎上改造全國。而這首先需要建立在我們知道這個地球是什么形狀的,哪里需要被改造。世界真實的聲音需要被聽到,建立一條通道異常要緊。

大模型時代的開源,意義就在這里。來自不同現實場景,又具有代碼能力的人們需要一個廣場,來讓技術主動和場景對齊,然后具有代表性的產品才沒準顯示。

這個廣場要供大家互動用,還要有豐盛且價格合適的算力資源,同時也需要足夠充足的可調用模型來做選擇。開發者要的是這樣一個閉環的開源生態,通義千問的特長開始出現出來。

算力是關于大模型所有想象力的基礎。通義千問背后的阿里云占有我國最強的智能算力儲備算作基礎設施支持。其智算集群可達最大十萬卡GPU規模,這意味著在阿里云上可以承載多個萬億參數大模型同時在線訓練,為大規模AI集群供給無擁塞通訊的自研RDMA網絡架構和低成本高可靠的高性能存儲CPFS。

而在4月,阿里云在推出通義千問的同時,也公布了史上最大幅度的一次降價,對比上一代主售產品最高可下降40%的同時,還開放了計算、存儲、數據庫、機器學習等核心產品免費試用的機會。這為大批新涌入的AI開發者供給了測驗和試錯的機會。

在阿里云的算力支撐下,像陶佳肖似的開發者開始帶著“野心”涌入魔搭社區。

去年11月的云棲大會上,阿里云與CCF開源發展委員會合伙推出AI模型社區“魔搭”ModelScope,在社區上線同時貢獻了300多個AI模型,全面開源開放,其中超過1/3為中文模型。上線一年后,魔搭社區上的AI開發者數量早已超過280萬人,AI模型超過2300+,下載超過1億+。

隨著大模型的熱潮轉向Agent,魔搭社區在今年9月推出了AI Agent開發框架ModelScope-Agent,并且搭建了一個“打樣產品”ModeScopeGPT,它允許調用社區里眾多AI模型的API,然后自主達成人類布置的任務。這個ModeScopeGPT 的調用量曾經超過了40萬次。

除了通義千問之外,Llama2、智譜AI、百川智能甚至最新推出大模型的零一萬物等近百款開源模型而今都已經進入社區。并且“而今大陸有一半大模型公司跑在阿里云上”,阿里云CTO周靖人在2023年云棲大會上這樣說的時候,魔搭早已是眼前中國規模最大、用戶最活躍的AI模型開源地。

當下加入的參數量

12月1日,阿里云舉行通義千問發布會,開源了通義千問720億參數模型Qwen-72B。在參數量上這是當今大陸主流視線中最大的開源大模型,而在能力上,Qwen-72B的性能已經在測驗中超越開源標桿Llama2-70B。

Qwen-72B的訓練基礎是3T tokens的高品質數據,它采用了更多的參數和訓練數據,實現了全面的性能抬高。這個模型延續了通義千問預訓練模型的卓越展示,在10個權威測試中取得開源模型中的最佳成績,并在某些評測中超越了非公開的GPT-3.5和GPT-4。

在英語任務方面,Qwen-72B在MMLU基準嘗試中獲得開源模型中的最高分。在中文任務中,它在CEVAL、CMMLU、Gaokao等評測中領先,甚至超過了GPT-4。在數學推理領域,Qwen-72B在GSM8K、MATH評測中遠超其他開源模型。同時,在代碼理解任務上,經過HumanEval和MBPP評測,Qwen-72B映現了顯著的進步,其代碼能力實現了質的飛躍。

從8月初開始,Qwen-7B和Qwen-7B-Chat兩款開源模型在魔搭社區上線開始,通義千問本身的模型開源開始提上日程。8月25日,以Qwen-7B為基座語言模型新意,支持圖文輸入,具備多模態音訊理解能力大規模視覺語言模型 Qwen-VL開源。

Qwen-VL開源的一個月往后,阿里云在9月25日開源了通義千問百億級的參數模型Qwen-14B及其對話模型Qwen-14B-Chat。這款模型在性能上開始頭一回看向Llama-70B,加上前幾款開源的模型,一個多月時間內在開源社區的下載量突破100萬,在性能和可用性的平衡上,70億和140億參數的尺寸也是對開發者最友好的。

但當這個大模型開源生態開始走深,開發者對模型的性能上限有了更高的要求,也就需要更大參數的模型。Qwen-72B開始吸引到一些初創團隊的目光。

“我對72B的模型抱有極度大的渴望,好奇72B在我們領域中的能力極限值。”

顏鑫是華東理工大學X-D Lab(心動實驗室)的成員,X-D Lab實驗室之前的酌量方向網羅社會計算與社會智能、群體智能與隱私保護、公共衛生與輿情監測、工業智能與智能系統等方面,大模型呈現往后,開始聚焦AI情感計算領域。

基于開源的通義千問基座模型,顏鑫和其他團隊成員陸續開發了心理健康大模型 MindChat(漫談)、醫療強壯大模型 Sunsimiao(孫思邈)、教育/考試大模型 GradChat(錦鯉)三款垂直領域大模型,此刻已有超過20萬人次使用過這三款大模型,累計提供了超過100萬次的問答服務。

研討到計算資源的限制以及一些客戶對于私有化部署的需求,顏鑫表示現時團隊在供應問答服務時7B或14B尺寸的大模型是更合適的選擇,但在更開放的學術酌量上——例如應該利用聯邦學習算法處理數據——Qwen-72B有著前者不具備的性能特長。

而開源模型參數量的向上思量,將來也有機會推動ModelScope-Agent這樣關于如何接近AGI的暢想更接近現實。

此前在阿里從事大數據業務近7年的秦續業,日前身份是未來速度Xorbits協同創始人&CEO。Xorbits打造了公司級的分布式推理框架Xinference。通過Xinference,開源模型允許降落在個人用戶和開發者的個人電腦上,企業用戶抑或在計算集群上輕松部署并管理模型,享受私有化部署帶來的安全、定制化以及低成本。

秦續業表態,倘使外接知識庫做問答應用,經過大模型召回一些數據,放到上下文中進行總結,最終給出有用的答復,那么小尺寸(10B以下)的模型是夠用的。萬一需要具備一定的邏輯推理能力的模型,20-30B的中等尺寸模型是比較好的選擇。

“但在Agent恐怕需要強大推理能力的場景中,70B+的大模型會更有優勢。”

AI Agent是秦續業遠處的祈盼,但他相似也是個現實主義者。眼下把模型用起來是更緊要的事情,所以Xorbits曾經攻克的焦點,是讓通義千問跑在一臺Mac電腦上。

秦續業覺得這一點能擊中很多人。由于很多開發者都是用Mac電腦,他們直白在本地拉起Qwen類別模型,可以極大提高開發效力。

Qwen序列的全尺寸完善不止一個72B的大參數模型。與Qwen-72B同步,阿里云本次開源了通義千問18億參數模型Qwen-1.8B和通義千問音頻大模型Qwen-Audio,至此,通義千問開源光譜曾經了覆蓋從18億、70億到140億、720億參數的4款大語言模型,以及視覺理解(Qwen-VL)、音頻理解兩款多模態大模型。

大模型的開源生態,這是AI時代最后恐怕洶涌而來的一味藥引。周靖人對通義千問的定位是“AI時代最開放的大模型”,目下打點好一切,靜待開發者登場了。

(舉報)

主站蜘蛛池模板: 铝机箱_铝外壳加工_铝外壳厂家_CNC散热器加工-惠州市铂源五金制品有限公司 | 工控机,嵌入式主板,工业主板,arm主板,图像采集卡,poe网卡,朗锐智科 | 沧州友城管业有限公司-内外涂塑钢管-大口径螺旋钢管-涂塑螺旋管-保温钢管生产厂家 | 日本东丽膜_反渗透膜_RO膜价格_超滤膜_纳滤膜-北京东丽阳光官网 日本细胞免疫疗法_肿瘤免疫治疗_NK细胞疗法 - 免疫密码 | 防火阀、排烟防火阀、电动防火阀产品生产销售商-德州凯亿空调设备有限公司 | 可程式恒温恒湿试验箱|恒温恒湿箱|恒温恒湿试验箱|恒温恒湿老化试验箱|高低温试验箱价格报价-广东德瑞检测设备有限公司 | 考勤系统_人事考勤管理系统_本地部署BS考勤系统_考勤软件_天时考勤管理专家 | 科研ELISA试剂盒,酶联免疫检测试剂盒,昆虫_植物ELISA酶免试剂盒-上海仁捷生物科技有限公司 | 北京自然绿环境科技发展有限公司专业生产【洗车机_加油站洗车机-全自动洗车机】 | 郑州宣传片拍摄-TVC广告片拍摄-微电影短视频制作-河南优柿文化传媒有限公司 | 河南空气能热水器-洛阳空气能采暖-洛阳太阳能热水工程-洛阳润达高科空气能商行 | 步进驱动器「一体化」步进电机品牌厂家-一体式步进驱动 | 质检报告_CE认证_FCC认证_SRRC认证_PSE认证_第三方检测机构-深圳市环测威检测技术有限公司 | 旗帜网络笔记-免费领取《旗帜网络笔记》电子书 | 集装袋吨袋生产厂家-噸袋廠傢-塑料编织袋-纸塑复合袋-二手吨袋-太空袋-曹县建烨包装 | 12cr1mov无缝钢管切割-15crmog无缝钢管切割-40cr无缝钢管切割-42crmo无缝钢管切割-Q345B无缝钢管切割-45#无缝钢管切割 - 聊城宽达钢管有限公司 | 365文案网_全网创意文案句子素材站| 电销卡 防封电销卡 不封号电销卡 电话销售卡 白名单电销卡 电销系统 外呼系统 | 东莞螺丝|东莞螺丝厂|东莞不锈钢螺丝|东莞组合螺丝|东莞精密螺丝厂家-东莞利浩五金专业紧固件厂家 | 水性绝缘漆_凡立水_绝缘漆树脂_环保绝缘漆-深圳维特利环保材料有限公司 | 外贮压-柜式-悬挂式-七氟丙烷-灭火器-灭火系统-药剂-价格-厂家-IG541-混合气体-贮压-非贮压-超细干粉-自动-灭火装置-气体灭火设备-探火管灭火厂家-东莞汇建消防科技有限公司 | 无锡网站建设_企业网站定制-网站制作公司-阿凡达网络 | 机床导轨_导轨板_滚轮导轨-上海旻佑精密机械有限公司 | 辊道窑炉,辊道窑炉厂家-山东艾希尔 | C形臂_动态平板DR_动态平板胃肠机生产厂家制造商-普爱医疗 | 除尘布袋_液体过滤袋_针刺毡滤料-杭州辉龙过滤技术有限公司 | 上海单片机培训|重庆曙海培训分支机构—CortexM3+uC/OS培训班,北京linux培训,Windows驱动开发培训|上海IC版图设计,西安linux培训,北京汽车电子EMC培训,ARM培训,MTK培训,Android培训 | 信阳网站建设专家-信阳时代网联-【信阳网站建设百度推广优质服务提供商】信阳网站建设|信阳网络公司|信阳网络营销推广 | 机床主轴维修|刀塔维修|C轴维修-常州翔高精密机械有限公司 | 纯化水设备-EDI-制药-实验室-二级反渗透-高纯水|超纯水设备 | 千淘酒店差旅平台-中国第一家针对TMC行业的酒店资源供应平台 | 不锈钢法兰-碳钢法兰-法兰盘生产加工厂家-[鼎捷峰]-不锈钢法兰-碳钢法兰-法兰盘生产加工厂家-[鼎捷峰] | 土壤肥料养分速测仪_测土配方施肥仪_土壤养分检测仪-杭州鸣辉科技有限公司 | 领先的大模型技术与应用公司-中关村科金| 小型数控车床-数控车床厂家-双头数控车床| 液晶拼接屏厂家_拼接屏品牌_拼接屏价格_监控大屏—北京维康 | ET3000双钳形接地电阻测试仪_ZSR10A直流_SXJS-IV智能_SX-9000全自动油介质损耗测试仪-上海康登 | 成都思迪机电技术研究所-四川成都思迪编码器 | 大立教育官网-一级建造师培训-二级建造师培训-造价工程师-安全工程师-监理工程师考试培训 | 海德莱电力(HYDELEY)-无功补偿元器件生产厂家-二十年专业从事电力电容器 | 苏州西朗门业-欧盟CE|莱茵UL双认证的快速卷帘门品牌厂家 |