
SINGAPURA, 1 Okt. 2023 — Baru-baru ini, Colossal-AI membangun model bahasa besar (LLM) spesifik domain yang luar biasa dengan menggunakan hanya beberapa ratus dolar biaya pelatihan. Ini dapat dengan mudah diterapkan di berbagai domain, memfasilitasi pembangunan model AI besar yang ekonomis.
Solusi ini dapat diakses tanpa pembatasan komersial apa pun, dengan transparansi total yang diperluas ke seluruh proses pelatihan, kode, dan bobot model.
Rincian teknis, kode sumber terbuka dan bobot tersedia di: https://github.com/hpcaitech/ColossalAI

Kinerja
Model Colossal-AI tidak hanya meningkatkan kemampuan bahasa Cina tetapi juga lebih menyempurnakan kemahirannya dalam bahasa Inggris. Luar biasanya, ini menunjukkan tingkat kinerja yang menyamai state-of-the-art (SOTA) model skala serupa dalam komunitas sumber terbuka.
Sehubungan dengan ini, Colossal-AI menawarkan kerangka evaluasi komprehensif, ColossalEval, yang memfasilitasi reproduktivitas hemat biaya.
Selain itu, fine-tuning melalui metode seperti SFT dan LoRA memiliki keterbatasan dalam menanamkan pengetahuan dan kemampuan dari model dasar secara efektif. Ini tidak memuaskan memenuhi persyaratan untuk membangun pengetahuan spesifik domain berkualitas tinggi atau aplikasi model khusus.
Menghubungkan Model Besar Umum ke Model Besar Spesifik Domain
Lebih penting lagi, penciptaan versi bahasa Cina tidak hanya menawarkan keuntungan dari dapat digunakan kembali tetapi juga membawa arti penting yang signifikan dalam skenario implementasi dunia nyata.
Sangat diakui bahwa biaya melatih model AI besar dari awal sangat mahal, sering dijuluki humor sebagai domain yang hanya bisa diakses oleh mereka yang memiliki “50 juta dolar” untuk dibuang.
Banyak raksasa teknologi dan startup AI ingin berinvestasi besar-besaran dalam membangun model tujuan umum skala besar. Namun, di balik generalitas model besar ini seringkali terdapat kurangnya pengetahuan spesifik domain. Akibatnya, masalah penerapan praktis menjadi sangat serius.
Jika model besar spesifik domain dapat dibangun dengan cepat dan hemat biaya, diikuti dengan fine-tuning untuk kebutuhan bisnis tertentu, itu pasti akan memajukan penerapan aplikasi, memberikan keunggulan kompetitif.
Menerapkan proses di atas untuk melakukan transfer pengetahuan di bidang apa pun memungkinkan konstruksi model besar dasar spesifik domain yang hemat biaya.
Untuk membangun model besar dasar dari awal, seseorang juga dapat mengambil inspirasi dari pengalaman tersebut di atas dan kemampuan pengurangan biaya dan peningkatan efisiensi Colossal-AI untuk secara efisien mencapai tujuan ini dengan biaya minimal.
Optimasi Sistem Colossal-AI dan Platform Cloud
Kinerja dan keunggulan biaya yang mengesankan dibangun di atas landasan sistem pengembangan model AI besar berbiaya rendah, Colossal-AI.
Colossal-AI memanfaatkan teknik efisien untuk mengurangi biaya pelatihan, fine-tuning, dan inferensi model AI besar. Ini telah berkolaborasi dengan berbagai perusahaan Fortune 500 dan perusahaan terkenal lainnya.
Untuk lebih meningkatkan efisiensi pengembangan dan penyebaran model besar, Colossal-AI telah ditingkatkan ke platform cloud Colossal-AI, yang sekarang berada di beta publik, dan pendaftaran akan memberi Anda voucher.
Platform Cloud Colossal-AI: platform.colossalai.com
Alamat Sumber Terbuka Colossal-AI: https://github.com/hpcaitech/ColossalAI
Tentang HPC-AI Tech
HPC-AI Tech adalah startup yang berkantor pusat di Singapura. Produk unggulannya, Colossal-AI, adalah sistem pembelajaran mendalam serba guna yang dirancang untuk era model AI besar. Ini memungkinkan penerapan pelatihan dan inferensi model AI besar yang efisien dan cepat, menghasilkan pengurangan biaya yang signifikan untuk aplikasi model AI besar. HPC-AI Tech mengumpulkan 22 juta USD dalam Pendanaan Seri A pada Juli 2023.
Untuk pertanyaan media atau informasi lebih lanjut, silakan hubungi:
contact@hpc-ai.tech
Foto – https://idnewszone.com/wp-content/uploads/2023/10/e4dd1b78-f2.jpg