لنگ چین (LangChain) چارچوبی است که برای ساده‌سازی ایجاد برنامه‌ها با استفاده از مدل‌های زبان بزرگ (LLM) طراحی شده‌است. به عنوان یک چارچوب ادغام مدل زبان، موارد استفاده لنگ چین تا حد زیادی با موارد استفاده از مدل‌های زبانی، همپوشانی دارند از کاربردهای مشترک می‌توان به تجزیه و تحلیل اسناد و خلاصه‌سازی، ربات‌های گفتگو و تجزیه و تحلیل کد اشاره کرد.[۱]

LangChain
توسعه‌دهنده(ها)Harrison Chase
انتشار اولیهOctober 2022
مخزنgithub.com/hwchase17/langchain
نوشته‌شده باPython and JavaScript
نوعSoftware framework for large language model application development
مجوزMIT License
وبگاه

زمینه

ویرایش

LangChainلنگ چین در اکتبر ۲۰۲۲ به عنوان یک پروژه منبع باز توسط هریسون چیس، در حالی که در استارتاپ یادگیری ماشینی هوشمندی توانمند کار می‌کرد، راه اندازی شد. این پروژه با بهبود صدها مشارکت کننده در گیت هاب، بحث‌های پرطرفدار در توییتر، فعالیت پر جنب و جوش در سرور دیسکورد، بسیاری از آموزش‌های یوتیوب جلسات در سانفرانسیسکو و لندن، به سرعت محبوبیت پیدا کرد. لنگ چین در آوریل ۲۰۲۳، یک هفته پس از اعلام سرمایه‌گذاری ۱۰ میلیون دلاری اولیه، بیش از ۲۰ میلیون دلار سرمایه با ارزش حداقل ۲۰۰ میلیون دلار از شرکت سرمایه‌گذاری Sequoia Capital جمع‌آوری کرد.[۲][۳]

ادغام‌ها

ویرایش

لنگ چین از مارس ۲۰۲۳، با سیستم‌های بسیاری ادغام شد. از آن جمله می‌توان به موارد زیر اشاره کرد: آمازون، گوگل، و ذخیره‌سازی ابری مایکروسافت آزوره ادغام شد. بسته‌های API برای اخبار، اطلاعات فیلم و آب و هوا؛ Bash برای خلاصه سازی، بررسی نحوی و معنایی، و اجرای اسکریپت‌های پوسته. چندین زیرسیستم و قالب خراش وب. پشتیبانی از نسل سریع یادگیری چند شات. پیدا کردن و خلاصه کردن وظایف "todo" در کد. خلاصه، استخراج و ایجاد اسناد، صفحات گسترده و ارائه‌های درایو گوگل؛ جستجوی گوگل و جستجوی وب مایکروسافت بینگ؛ مدل‌های زبان OpenAI, Anthropic و Hugging Face. راهنمای تعمیر iFixit و جستجو و خلاصه سازی ویکی‌ها. MapReduce برای پاسخگویی به سؤال، ترکیب اسناد و تولید سؤال. امتیازدهی همپوشانی N گرم؛ PyPDF, pdfminer, fitz، و pymupdf برای استخراج و دستکاری متن فایل PDF. تولید، تجزیه و تحلیل و اشکال زدایی کد پایتون و جاوا اسکریپت. پیوند دادن پایگاه داده برداری به جاسازی کش و اشیاء داده. ذخیره‌سازی پایگاه داده کش Redis ; Python RequestsWrapper و روش‌های دیگر برای درخواست‌های API. پایگاه داده‌های SQL و NoSQL از جمله پشتیبانی JSON. Streamlit، از جمله برای ورود به سیستم؛ نگاشت متن برای k-نزدیکترین همسایه جستجو. تبدیل منطقه زمانی و عملیات تقویم؛ ردیابی و ثبت نمادهای پشته در اجراهای فرعی رشته‌ای و ناهمزمان. و وب سایت ولفرم آلفا و SDK.[۴] لنگ چین از آوریل ۲۰۲۳، می‌تواند از بیش از ۵۰ نوع سند و منبع داده بخواند.[۵]

منابع

ویرایش
  1. Buniatyan, Davit (2023). "Code Understanding Using LangChain". Activeloop.
  2. Palazzolo, Stephanie (2023-04-13). "AI startup LangChain taps Sequoia to lead funding round at a valuation of at least $200 million". Business Insider (به انگلیسی). Archived from the original on 2023-04-18. Retrieved 2023-04-18.
  3. Griffith, Erin; Metz, Cade (2023-03-14). "'Let 1,000 Flowers Bloom': A.I. Funding Frenzy Escalates". The New York Times (به انگلیسی). ISSN 0362-4331. Archived from the original on 2023-04-18. Retrieved 2023-04-18.
  4. Hug, Daniel Patrick (2023-03-08). "Hierarchical topic tree of LangChain's integrations". GitHub. Archived from the original (PDF) on 2023-04-29. Retrieved 2023-04-18.
  5. "Document Loaders — LangChain 0.0.142". python.langchain.com. Archived from the original on 2023-04-18. Retrieved 2023-04-18.