DeepSeek: AI ландшафтыг өөрчилсөн эвдэрсэн зүйл

AIPU WATON ГРУПП

Танилцуулга

Өрсөлдөж буй томоохон загварууд, зах зээлд эзлэхийн төлөө өрсөлдөж буй үүлэн үйлчилгээ үзүүлэгчид, шаргуу чип үйлдвэрлэгчдийн дунд түгшүүртэй байдал - DeepSeek-ийн нөлөө хэвээр байна.

Хаврын баяр ойртох тусам DeepSeek-ийг тойрсон сэтгэл хөдлөл хүчтэй хэвээр байна. Саяхан болсон баяр нь технологийн салбар дахь өрсөлдөөний чухал мэдрэмжийг онцолж, олон хүн энэ "муур загас" -ын талаар хэлэлцэж, дүн шинжилгээ хийсэн. Цахиурын хөндийд урьд өмнө байгаагүй хямралын мэдрэмжийг мэдэрч байна: нээлттэй эх сурвалжийг дэмжигчид дахин санал бодлоо илэрхийлж, OpenAI хүртэл хаалттай эх сурвалжийн стратеги нь хамгийн сайн сонголт байсан эсэхийг дахин үнэлж байна. Тооцооллын зардал бага гэсэн шинэ парадигм нь Nvidia зэрэг чип аваргуудын дунд гинжин урвал үүсгэж, АНУ-ын хөрөнгийн зах зээлийн түүхэнд нэг өдрийн зах зээлийн үнийн алдагдалд хүргэсэн бол засгийн газрын агентлагууд DeepSeek-ийн ашигладаг чипүүд нийцэж байгаа эсэхийг судалж байна. Гадаадад, дотоодод DeepSeek-ийн талаархи холимог шүүмжүүдийн дунд энэ нь ер бусын өсөлтийг туулж байна. R1 загварыг гаргасны дараа холбогдох програмын ачаалал нэмэгдэж байгаа нь хэрэглээний салбар дахь өсөлт нь хиймэл оюун ухааны ерөнхий экосистемийг урагшлуулах болно гэдгийг харуулж байна. Эерэг тал нь DeepSeek нь хэрэглээний боломжуудыг өргөжүүлж, ChatGPT-д найдах нь ирээдүйд тийм ч үнэтэй биш гэдгийг харуулж байна. Энэ өөрчлөлт нь OpenAI-ийн сүүлийн үеийн үйл ажиллагаанд тусгалаа олсон бөгөөд үүнд DeepSeek R1-ийн хариуд үнэгүй хэрэглэгчдэд зориулсан o3-mini хэмээх үндэслэлийн загвар, мөн o3-mini-ийн бодлын хэлхээг олон нийтэд нээлттэй болгосон дараагийн шинэчлэлтүүд багтсан. Гадаадын олон хэрэглэгчид DeepSeek-д эдгээр бүтээн байгуулалтад талархаж байгаагаа илэрхийлсэн ч энэхүү бодлын хэлхээ нь хураангуй болж өгдөг.

Өөдрөгөөр харахад DeepSeek дотоодын тоглогчдыг нэгтгэж байгаа нь илт байна. Сургалтын зардлыг бууруулахад анхаарлаа төвлөрүүлснээр янз бүрийн дээд талын чип үйлдвэрлэгчид, завсрын үүлэн үйлчилгээ үзүүлэгчид болон олон тооны гарааны компаниуд экосистемд идэвхтэй нэгдэж, DeepSeek загварыг ашиглах зардлын үр ашгийг дээшлүүлж байна. DeepSeek-ийн баримт бичгийн дагуу V3 загварыг бүрэн сургахад ердөө 2.788 сая H800 GPU цаг шаардлагатай бөгөөд сургалтын үйл явц нь маш тогтвортой байдаг. 405 тэрбум параметр бүхий Лама 3-тай харьцуулахад сургалтын өмнөх зардлыг арав дахин бууруулахад МЭ (Мэргэжилтнүүдийн холимог) архитектур маш чухал юм. Одоогийн байдлаар V3 бол БМ-д ийм өндөр сийрэгжилтийг харуулсан олон нийтэд хүлээн зөвшөөрөгдсөн анхны загвар юм. Нэмж дурдахад MLA (Multi Layer Attention) нь синергетик байдлаар ажилладаг, ялангуяа үндэслэлийн тал дээр. Chuanjing Technology-ийн судлаач AI Technology Review сэтгүүлд хийсэн дүн шинжилгээ хийхдээ "МЭА сийрэг байх тусам тооцооллын хүчийг бүрэн ашиглахад шаардагдах багцын хэмжээ их байх тусам KVCache-ийн хэмжээ хязгаарлах гол хүчин зүйл болно; MLA нь KVCache-ийн хэмжээг эрс багасгадаг" гэж тэмдэглэжээ. Ерөнхийдөө DeepSeek-ийн амжилт нь ганц нэг биш, янз бүрийн технологиудын хослолд оршдог. Салбарын мэргэжилтнүүд DeepSeek багийн инженерийн чадавхийг магтан сайшааж, тэдгээрийн зэрэгцээ сургалт, операторын оновчлолын талаар онцлон тэмдэглэж, нарийн ширийн зүйл бүрийг боловсронгуй болгосноор шинэлэг үр дүнд хүрдэг. DeepSeek-ийн нээлттэй эх сурвалжийн арга нь том загваруудын ерөнхий хөгжлийг улам эрчимжүүлж байгаа бөгөөд хэрэв ижил төстэй загварууд зураг, видео болон бусад зүйлээр өргөжиж байвал энэ нь салбарын эрэлтийг мэдэгдэхүйц нэмэгдүүлэх болно гэж таамаглаж байна.

Гуравдагч этгээдийн үндэслэл тогтоох үйлчилгээний боломжууд

Мэдээллийн дагуу DeepSeek нь худалдаанд гарсан цагаасаа хойш ердөө 21 хоногийн дотор өдөр бүр 22.15 сая идэвхтэй хэрэглэгч (DAU) цуглуулж, ChatGPT-ийн хэрэглэгчийн баазын 41.6%-д хүрч, Doubao-н өдөр тутмын 16.95 сая идэвхтэй хэрэглэгчийг давж, дэлхийн хэмжээнд хамгийн хурдацтай хөгжиж буй аппликейшн болж, Apple Store-ын улс орнуудад тэргүүлж байна15. Гэсэн хэдий ч хэрэглэгчид бөөн бөөнөөрөө цугларч байхад кибер хакерууд DeepSeek програм руу тасралтгүй дайрч, серверт нь ихээхэн дарамт учруулж байна. Салбарын шинжээчид энэ нь DeepSeek картуудыг сургалтанд суулгаж, үндэслэл гаргахад хангалттай тооцоолох чадваргүйтэй холбоотой гэж үзэж байна. Салбарын нэг хүн AI Technology Review сэтгүүлд "Серверийн байнгын асуудлуудыг хураамж авах эсвэл илүү олон машин худалдаж авах санхүүжилтээр амархан шийдэж болно; эцсийн дүндээ DeepSeek-ийн шийдвэрээс шалтгаална." Энэ нь үйлдвэрлэл, технологид анхаарлаа төвлөрүүлж буйг харуулж байна. DeepSeek нь өөрийгөө тэжээхийн тулд квант квантчлалд голлон тулгуурласан бөгөөд гаднаас бага хэмжээний санхүүжилт авсны улмаас мөнгөний урсгалын дарамт харьцангуй бага, илүү цэвэр технологийн орчин бий болсон. Одоогоор дээр дурдсан асуудлуудын үүднээс зарим хэрэглэгчид DeepSeek-ийг нийгмийн сүлжээгээр дамжуулан хэрэглээний босгыг нэмэгдүүлэх эсвэл хэрэглэгчийн тав тухыг сайжруулахын тулд төлбөртэй функцуудыг нэвтрүүлэхийг уриалж байна. Нэмж дурдахад, хөгжүүлэгчид албан ёсны API эсвэл гуравдагч талын API-г оновчтой болгохын тулд ашиглаж эхэлсэн. Гэсэн хэдий ч DeepSeek-ийн нээлттэй платформ саяхан "Одоогийн серверийн нөөц хомс, API үйлчилгээний цэнэглэлтийг түр зогсоосон" гэж зарлав.

 

Энэ нь хиймэл оюун ухааны дэд бүтцийн салбарт гуравдагч талын үйлдвэрлэгчдэд илүү их боломжийг нээж өгөх нь дамжиггүй. Саяхан дотоодын болон олон улсын үүлэн аваргууд DeepSeek-ийн загвар API-уудыг эхлүүлсэн бөгөөд 1-р сарын сүүлээр гадаад дахь аварга том Microsoft болон Amazon нар нэгдэв. Дотоодын удирдагч Huawei Cloud анхны алхамаа хийж, Silicon-based Flow-тай хамтран DeepSeek R1 болон V3 үндэслэлийн үйлчилгээг 2-р сарын 1-нд гаргасан. AI Technology Review-ийн тайлангаас харахад Цахиурт суурилсан Flow-ийн үйлчилгээнүүд хэрэглэгчдийн шилжилт хөдөлгөөнийг ажиглаж, платформыг үр дүнтэй "гацааж" байна. Технологийн гурван том компани болох BAT (Baidu, Alibaba, Tencent) болон ByteDance нар 2-р сарын 3-наас эхлэн хямд өртөгтэй, хязгаарлагдмал хугацаатай саналуудыг гаргасан нь өнгөрсөн жилийн DeepSeek-ийн V2 загвар нээлтээ хийснээр үүлэн борлуулагчдын үнийн дайныг санагдуулж, DeepSeek-ийг "үнийн махчин" гэж нэрлэж эхэлсэн. Клоуд үйлдвэрлэгчдийн догдолж буй үйлдэл нь Microsoft Azure болон OpenAI хоёрын өмнөх бат бөх харилцааг давтаж байгаа бөгөөд 2019 онд Microsoft OpenAI-д 1 тэрбум долларын хөрөнгө оруулалт хийж, ChatGPT-ийг 2023 онд гаргасны дараа үр өгөөжөө олж авсан. Гэсэн хэдий ч энэхүү ойр дотно харилцаа нь Мета нээлттэй эх сурвалжтай Llama-ийн дараа муудаж эхэлсэн нь Microsoft-ын томоохон загвар өмсөгчдөөс гадна бусад үйлдвэрлэгчидтэй өрсөлдөх боломжийг олгосон юм. Энэ тохиолдолд DeepSeek нь бүтээгдэхүүний дулааны хувьд ChatGPT-ийг даваад зогсохгүй, Llama GPT-3-ыг сэргээсэнтэй адил o1 хувилбарын дараа нээлттэй эхийн загваруудыг нэвтрүүлсэн.

 

Бодит байдал дээр үүл үйлчилгээ үзүүлэгчид хиймэл оюун ухааны программуудын замын хөдөлгөөний гарц болж байгаа нь хөгжүүлэгчидтэй харилцаагаа гүнзгийрүүлэх нь давуу талтай гэсэн үг юм. Мэдээлэлд дурдсанаар Baidu Smart Cloud загвараа танилцуулах өдөр Qianfan платформоор DeepSeek загварыг ашигласан 15,000 гаруй хэрэглэгчтэй байсан. Нэмж дурдахад хэд хэдэн жижиг фирмүүд шийдлүүдийг санал болгож байгаа бөгөөд үүнд Silicon-based Flow, Luchen Technology, Chuanjing Technology, DeepSeek загваруудад дэмжлэг үзүүлж эхэлсэн төрөл бүрийн AI Infra үйлчилгээ үзүүлэгчид орно. AI Технологийн тойм нь DeepSeek-ийг локалчлагдсан байршуулах одоогийн оновчлолын боломжууд үндсэндээ хоёр чиглэлээр байгааг олж мэдсэн: нэг нь холимог үндэслэлийн хандлагыг ашиглан 671 тэрбум параметрийн MoE загварыг орон нутагт байрлуулахын зэрэгцээ эрлийз GPU/CPU дүгнэлтийг ашиглахын тулд БХЯ-ны загварын сийрэг байдлын шинж чанарыг оновчтой болгох явдал юм. Нэмж дурдахад MLA-г оновчтой болгох нь амин чухал юм. Гэсэн хэдий ч DeepSeek-ийн хоёр загвар нь байршуулалтыг оновчтой болгоход зарим бэрхшээлтэй тулгарсан хэвээр байна. Чуанжин Технологийн судлаач хэлэхдээ "Загварын хэмжээ болон олон тооны параметрүүдээс шалтгаалан оновчлол нь үнэхээр төвөгтэй байдаг, ялангуяа орон нутгийн байршилд гүйцэтгэл, зардлын оновчтой тэнцвэрийг бий болгоход хэцүү байх болно" гэж хэлэв. Хамгийн чухал бэрхшээл бол санах ойн багтаамжийн хязгаарыг даван туулах явдал юм. "Бид CPU болон бусад тооцооллын нөөцийг бүрэн ашиглахын тулд харилцан адилгүй хамтын ажиллагааны арга барилыг хэрэгжүүлж, сийрэг МЭ-ийн матрицын зөвхөн хуваалцаагүй хэсгийг CPU/DRAM дээр өндөр гүйцэтгэлтэй CPU операторууд ашиглан боловсруулахад байрлуулж, нягт хэсгүүд нь GPU дээр үлддэг" гэж тэр цааш тайлбарлав. Chuanjing-ийн нээлттэй эхийн хүрээний KTransformers нь загвараар дамжуулан анхны Transformers-ийн хэрэгжилтэд янз бүрийн стратеги, операторуудыг оруулж, CUDAGraph гэх мэт аргуудыг ашиглан дүгнэлт гаргах хурдыг ихээхэн нэмэгдүүлдэг болохыг тайланд дурджээ. Өсөлтийн үр ашиг нь тодорхой болж байгаа тул DeepSeek эдгээр гарааны бизнесүүдэд боломжуудыг бий болгосон; Олон пүүсүүд DeepSeek API-г ажиллуулсны дараа оновчлолыг хайж байсан өмнөх үйлчлүүлэгчдийнхээ хүсэлтийг хүлээн авсны дараа хэрэглэгчдийн мэдэгдэхүйц өсөлт гарсан гэж мэдээлсэн. Салбарын мэргэжилтнүүд "Өмнө нь тодорхой хэмжээний үйлчлүүлэгчдийн бүлгүүд томоохон компаниудын стандартчилсан үйлчилгээнд түгжигддэг байсан. Энэ нь цар хүрээгээсээ шалтгаалж зардлын давуу талаасаа нягт холбоотой байсан. Гэвч хаврын баяраас өмнө DeepSeek-R1/V3-ийг суулгаж дууссаны дараа бид гэнэт хэд хэдэн алдартай үйлчлүүлэгчдээс хамтран ажиллах хүсэлт хүлээн авч, Deep-ийн харилцагчийн үйлчилгээгээ танилцуулж эхэлсэн." Одоогийн байдлаар DeepSeek нь загварын дүгнэлтийн гүйцэтгэлийг улам чухал болгож байгаа бөгөөд том загваруудыг өргөнөөр нэвтрүүлснээр энэ нь AI Infra салбарын хөгжилд мэдэгдэхүйц нөлөө үзүүлсээр байх болно. Хэрэв DeepSeek түвшний загварыг орон нутагт бага зардлаар ашиглах боломжтой бол энэ нь засгийн газар болон аж ахуйн нэгжийн дижитал өөрчлөлтийн хүчин чармайлтад ихээхэн тус болно. Гэсэн хэдий ч зарим үйлчлүүлэгчид томоохон загварын чадавхийн талаар өндөр хүлээлттэй байж болох тул гүйцэтгэл, зардлыг тэнцвэржүүлэх нь практик хэрэглээнд чухал ач холбогдолтой болох нь тодорхой болж байгаа тул сорилтууд байсаар байна. 

DeepSeek нь ChatGPT-ээс илүү эсэхийг үнэлэхийн тулд тэдгээрийн гол ялгаа, давуу тал, хэрэглээний тохиолдлуудыг ойлгох нь чухал юм. Энд иж бүрэн харьцуулалт байна:

Онцлог/Аспект DeepSeek ChatGPT
Өмчлөл Хятадын компани боловсруулсан OpenAI боловсруулсан
Эх загвар Нээлттэй эх сурвалж Өмчлөгч
Зардал Үнэгүй ашиглах; API хандалтын хямд сонголтууд Захиалга эсвэл ашиглалтын төлбөр
Тохируулга Маш сайн тохируулах боломжтой тул хэрэглэгчдэд үүнийг өөрчлөх, бүтээх боломжийг олгодог Хязгаарлагдмал тохируулга хийх боломжтой
Тодорхой ажлуудын гүйцэтгэл Өгөгдлийн аналитик, мэдээлэл хайх гэх мэт тодорхой чиглэлээр Excel програмууд Бүтээлч бичих болон харилцан ярианы даалгавруудыг маш сайн гүйцэтгэдэг олон талт
Хэлний дэмжлэг Хятад хэл, соёлд ихээхэн анхаарал хандуулж байна Хэлний өргөн дэмжлэгтэй боловч АНУ төвтэй
Сургалтын зардал Сургалтын зардлыг бууруулж, үр ашгийг дээшлүүлэх Их хэмжээний тооцооллын нөөц шаарддаг сургалтын зардал өндөр
Хариултын өөрчлөлт Геополитикийн нөхцөл байдлаас шалтгаалж өөр өөр хариулт өгч магадгүй Сургалтын мэдээлэлд тулгуурласан тууштай хариултууд
Зорилтот үзэгчид Уян хатан байдлыг хүсч буй хөгжүүлэгчид болон судлаачдад зориулагдсан Харилцан ярианы чадварыг хайж буй нийтлэг хэрэглэгчдэд зориулагдсан
Хэрэглэх тохиолдлууд Код үүсгэх, хурдан даалгавар хийхэд илүү үр дүнтэй Текст үүсгэх, асуулгад хариулах, харилцан яриа өрнүүлэхэд тохиромжтой

"Nvidia-г тасалдуулах" талаархи шүүмжлэлтэй үзэл бодол

Одоогийн байдлаар Huawei-ээс гадна Moore Threads, Muxi, Biran Technology, Tianxu Zhixin зэрэг дотоодын хэд хэдэн чип үйлдвэрлэгчид DeepSeek-ийн хоёр загварт дасан зохицож байна. Чип үйлдвэрлэгч AI Technology Review-д хэлэхдээ, "DeepSeek-ийн бүтэц нь инновацийг харуулж байгаа ч энэ нь LLM хэвээр байна. Бидний DeepSeek-д дасан зохицох нь үндсэндээ хэрэглээний үндэслэлийг гаргахад чиглэгдэж, техникийн хэрэгжилтийг нэлээд хялбар бөгөөд хурдан болгодог." Гэсэн хэдий ч МЯ-ны арга барил нь хадгалалт, түгээлтийн хувьд илүү өндөр шаардлагыг шаарддаг бөгөөд үүнийг дасан зохицох явцад шийдвэрлэх шаардлагатай олон тооны инженерийн сорилтуудыг бий болгож, дотоодын чипүүдийг байрлуулахдаа нийцтэй байдлыг хангахыг шаарддаг. "Одоогийн байдлаар дотоодын тооцооллын хүчин чадал Nvidia-тай тохирохгүй, тогтвортой байдал, програм хангамжийн орчны тохиргоо, алдааг олж засварлах, үндсэн гүйцэтгэлийг оновчтой болгоход үйлдвэрийн анхны оролцоо шаардлагатай" гэж практик туршлага дээр үндэслэн хэлжээ. Үүний зэрэгцээ, "DeepSeek R1-ийн том параметрийн масштабын улмаас дотоодын тооцооллын хүчин чадал нь зэрэгцээ болгоход илүү олон зангилаа шаардагддаг. Үүнээс гадна дотоодын техник хангамжийн үзүүлэлтүүд бага зэрэг хоцрогдсон хэвээр байна; жишээлбэл, Huawei 910B одоогоор DeepSeek-ийн танилцуулсан FP8 дүгнэлтийг дэмжих боломжгүй байна." DeepSeek V3 загварын онцлох үйл явдлуудын нэг нь FP8 холимог нарийвчлалтай сургалтын тогтолцоог нэвтрүүлсэн нь маш том загвар дээр үр дүнтэй батлагдсан нь чухал амжилтыг харуулж байна. Өмнө нь Майкрософт болон Nvidia зэрэг томоохон тоглогчид холбогдох ажлыг санал болгож байсан ч техник эдийн засгийн үндэслэлтэй эсэх талаар эргэлзэж байсан. INT8-тай харьцуулахад FP8-ийн гол давуу тал нь сургалтын дараах хэмжигдэхүүн нь бараг алдагдалгүй нарийвчлалд хүрэхийн зэрэгцээ дүгнэлт хийх хурдыг ихээхэн нэмэгдүүлэх явдал юм. FP16-тай харьцуулахад FP8 нь Nvidia-ийн H20 дээр хоёр дахин, H100 дээр 1.5 дахин их хурдатгал хийх боломжтой. Дотоодын тооцооллын хүч болон дотоодын загваруудыг тойрсон хэлэлцүүлэг хүчээ авч байгаа тул Nvidia-г тасалдуулах эсэх, CUDA суваг шуудууг тойрч гарах эсэх талаарх таамаглал улам бүр газар авч байна. Нэг үгүйсгэх аргагүй баримт бол DeepSeek үнэхээр Nvidia-ийн зах зээлийн үнэ цэнийг ихээхэн унагасан боловч энэхүү өөрчлөлт нь Nvidia-ийн өндөр түвшний тооцооллын хүчин чадлын бүрэн бүтэн байдлын талаар асуултуудыг төрүүлж байна. Хөрөнгийн үндсэн дээр суурилсан тооцооллын хуримтлалтай холбоотой урьд өмнө хүлээн зөвшөөрөгдсөн түүхүүд маргаантай байгаа ч Nvidia-г сургалтын хувилбарт бүрэн солих нь хэцүү хэвээр байна. DeepSeek-ийн CUDA-г гүнзгий ашигласан дүн шинжилгээ нь SM-г харилцаа холбоонд ашиглах эсвэл сүлжээний картыг шууд удирдах гэх мэт уян хатан байдал нь ердийн GPU-д нийцэхгүй байгааг харуулж байна. Салбарын үзэл бодол нь Nvidia-ийн шуудуу нь зөвхөн CUDA биш харин CUDA экосистемийг бүхэлд нь хамардаг гэдгийг онцолж байгаа бөгөөд DeepSeek-ийн ашигладаг PTX (Parallel Thread Execution) заавар нь CUDA экосистемийн нэг хэсэг хэвээр байна. "Богино хугацаанд Nvidia-ийн тооцооллын хүчин чадлыг тойрч гарах боломжгүй - энэ нь сургалтанд ялангуяа тодорхой харагдаж байна; Гэсэн хэдий ч үндэслэл гаргахад дотоодын картуудыг ашиглах нь харьцангуй хялбар байх тул ахиц дэвшил илүү хурдан байх болно. Дотоодын картуудыг дасан зохицох нь голчлон дүгнэлтэд чиглэгддэг; хэн ч DeepSeek-ийн гүйцэтгэлийн загварыг дотоодын картууд дээр сургаж чадаагүй байна" гэж AI технологийн салбарынхан дахин тэмдэглэв. Ерөнхийдөө, дүгнэлтийн үүднээс авч үзвэл нөхцөл байдал нь дотоодын том загварын чипүүдэд урам зориг өгч байна. Дотоодын чип үйлдвэрлэгчдэд үзүүлэх боломжууд нь сургалтын хэт өндөр шаардлагаас шалтгаалан илүү тод харагдаж байгаа бөгөөд энэ нь элсэхэд саад болж байна. Шинжээчдийн үзэж байгаагаар дотоодын дүгнэлтийн картыг ашиглах нь хангалттай гэж үздэг; Шаардлагатай бол нэмэлт машин авах боломжтой байдаг бол сургалтын загвар нь өвөрмөц сорилтуудыг үүсгэдэг - олон тооны машиныг удирдах нь ачаалал ихтэй, алдааны түвшин өндөр байх нь сургалтын үр дүнд сөргөөр нөлөөлдөг. Сургалт нь мөн кластерын масштабын тодорхой шаардлагуудтай байдаг бол кластерт тавих шаардлага тийм ч хатуу биш тул GPU-ийн шаардлагыг хөнгөвчилдөг. Одоогийн байдлаар Nvidia-ийн ганц H20 картын гүйцэтгэл нь Huawei эсвэл Cambrian-аас давж гарахгүй байна; түүний хүч нь бөөгнөрөлд оршдог. Тооцооллын эрчим хүчний зах зээлд үзүүлж буй ерөнхий нөлөөллийн үндсэн дээр Лучен Технологийн үүсгэн байгуулагч You Yang AI Technology Review сэтгүүлд өгсөн ярилцлагадаа "DeepSeek нь хэт том сургалтын тооцооллын кластеруудыг байгуулах, түрээслэх үйл ажиллагааг түр хугацаанд сулруулж болзошгүй. Урт хугацаанд томоохон загварын сургалттай холбоотой зардлыг мэдэгдэхүйц бууруулж, AI технологид суурилсан үндэслэл, эрэлт хэрэгцээг нэмэгдүүлэх боломжтой. Энэ нь тооцооллын эрчим хүчний зах зээл дэх тогтвортой эрэлтийг байнга хөдөлгөх болно." Нэмж дурдахад, "DeepSeek-ийн үндэслэл, нарийн тааруулах үйлчилгээний эрэлт нэмэгдэж байгаа нь орон нутгийн чадавхи харьцангуй сул байгаа дотоодын тооцооллын ландшафттай илүү нийцэж байгаа нь кластер байгуулсны дараа сул зогсолттой нөөцийн хаягдлыг багасгахад тусалдаг; энэ нь дотоодын тооцооллын экосистемийн янз бүрийн түвшний үйлдвэрлэгчдэд амьдрах боломжтой боломжийг бүрдүүлдэг." Лучен Технологи нь Huawei Cloud-тай хамтран DeepSeek R1 цувралын логик API болон дотоодын тооцооллын хүчин чадалд суурилсан үүлэн дүрслэлийн үйлчилгээг эхлүүлсэн. Та Ян ирээдүйн талаар өөдрөг үзэлтэй байгаагаа илэрхийлэв: "DeepSeek нь дотооддоо үйлдвэрлэсэн шийдлүүдэд итгэх итгэлийг төрүүлж, цаашид дотоодын тооцооллын чадавхид илүү их урам зориг, хөрөнгө оруулалтыг урамшуулж байна."

微信图片_20240614024031.jpg1

Дүгнэлт

DeepSeek нь ChatGPT-ээс "илүү сайн" эсэх нь хэрэглэгчийн тодорхой хэрэгцээ, зорилгоос хамаарна. Уян хатан байдал, хямд өртөг, өөрчлөн тохируулах шаардлагатай ажлуудын хувьд DeepSeek илүү сайн байж болох юм. Бүтээлч бичих, ерөнхий лавлагаа, хэрэглэгчдэд ээлтэй харилцан ярианы интерфейсийн хувьд ChatGPT тэргүүлж магадгүй юм. Хэрэгсэл бүр өөр өөр зорилготой тул сонголт нь тэдгээрийг ашиглаж буй нөхцөл байдлаас ихээхэн шалтгаална.

ELV кабелийн шийдлийг олох

Хяналтын кабель

BMS, BUS, Industrial, Instrumentation Cable-д зориулагдсан.

Кабелийн бүтэцтэй систем

Сүлжээ ба өгөгдөл, шилэн кабель, нөхөөсийн утас, модулиуд, нүүрэн тал

2024 оны үзэсгэлэн, арга хэмжээний тойм

2024 оны 4-р сарын 16-18-ны хооронд Дубай дахь Ойрхи Дорнод-Эрчим хүч

2024 оны 4-р сарын 16-18-ны өдрүүдэд Москва дахь Секурика

2024 оны 5-р сарын 9-ний өдөр Шанхай хотод ШИНЭ БҮТЭЭГДЭХҮҮН, ТЕХНОЛОГИЙН НЭЛХИЙН ҮЙЛ ЯВДАЛ

2024 оны 10-р сарын 22-оос 25-ны өдрүүдэд Бээжинд АЮУЛГҮЙ БАЙДАЛ ХЯТАД

2024 оны 11-р сарын 19-20, CONNECTED WORLD KSA


Шуудангийн цаг: 2025 оны 2-р сарын 10