Иновациите на Snowflake в AI моделите за текст в SQL и извличане
Иновациите на Snowflake в AI моделите: Решаване на проблемите при внедряване в предприятията
В постоянно развиващия се свят на изкуствения интелект (AI), Snowflake се откроява, като се фокусира върху два основни предизвикателства при внедряването на AI в предприятията: преобразуването на текст в SQL и оптимизацията на AI извличането. Чрез пионерски усилия в областта на отворения код – Arctic-Text2SQL-R1 и Arctic Inference – Snowflake цели да преодолее тези препятствия, проправяйки пътя към по-ефективни и надеждни AI внедрявания. Тази статия разглежда тези иновативни решения, изследвайки техните въздействия върху AI в предприятията и потенциалния им ефект върху индустрията.
Разбиране на предизвикателствата
Системите за преобразуване на текст в SQL и извличането на изводи отдавна са предизвикателство за предприятията, които искат да използват AI ефективно. Въпреки че възможностите за текст в SQL са подобрени с големите езикови модели (LLMs), проблемите остават. Чести проблеми включват генерирането на привидно правдоподобни, но грешни SQL заявки, които се провалят при изпълнение срещу реални бази данни на предприятия. По същия начин, системите за AI извличане често принуждават предприятията да избират между производителност и ценова ефективност поради ограничените възможности за паралелизация.
Подходът на Snowflake, ориентиран към предприятията
Подходът на Snowflake, както е описан от Дварак Раджагопал, вицепрезидент по AI инженеринг и изследвания, се фокусира върху решаването на реални предизвикателства на AI в предприятията, вместо да преследва академични критерии. Този прагматизъм доведе до разработката на Arctic-Text2SQL-R1 и Arctic Inference, и двете съобразени с изискванията на корпоративните среди.
Arctic-Text2SQL-R1: Пробив в генерирането на SQL заявки
Разбиране на проблема
Въпреки че няколко LLMs могат да преобразуват естествен език в SQL, те срещат трудности, когато заявките станат сложни, често се провалят при сложни схеми, неясни входни данни или вложена логика. Юксионг Хе, изтъкнат софтуерен инженер по AI в Snowflake, подчертава, че съществуващите модели са обучени да имитират модели, вместо да постигат точност при изпълнение.
Решението: Учене с подсилване, съобразено с изпълнението
Arctic-Text2SQL-R1 използва учене с подсилване, съобразено с изпълнението, което се различава от традиционните подходи, които приоритизират синтактичната相似ност. Вместо това, то оптимизира за точност на изпълнение, обучавайки моделите да проверяват дали генерираните SQL заявки се изпълняват правилно и дават точни резултати. Тази техника използва Group Relative Policy Optimization (GRPO), за да награждава успешното изпълнение, което представлява ключова промяна в обучението на моделите.
Arctic Inference: Подобряване на производителността на AI системите
Решаване на неефективностите при извличането
Традиционните системи за AI извличане поставят избор между оптимизация за време на отговор или ценова ефективност. Тези компромиси възникват поради несъвместими стратегии за паралелизация, които не могат да съществуват едновременно. Arctic Inference въвежда Shift Parallelism, за да разреши тези неефективности.
Shift Parallelism: Променящ играта
Shift Parallelism динамично настройва стратегиите за паралелизация в отговор на трафика в реално време, поддържайки съвместимост с наличните GP ресурси. Тази иновация позволява двойно подобрение във времената за отговор в сравнение с други решения с отворен код. Тя е внедрима с vLLM плъгина, насърчавайки съвместимост с Kubernetes и други установени работни процеси.
Стратегически последици за AI в предприятията
За предприятията иновациите на Snowflake представляват значителен напредък в готовността на AI инфраструктурата за внедряване в производство. Arctic-Text2SQL-R1 запълва разликата между външния вид на генерираните от AI SQL заявки и реалността на тяхното изпълнение, повишавайки надеждността на бизнес прозренията, извлечени от анализ на данни.
Освен това, обещанието на Arctic Inference за по-добра производителност и лесно внедряване опростява инфраструктурата, потенциално намалявайки разходите и сложността за предприятията, управляващи множество AI конфигурации за извличане.
Заключение
Инициативите на Snowflake Arctic подчертават ангажимента към развитието на AI инструменти с отворен код, които отговарят на нуждите на предприятията, предлагайки решения на разпространените предизвикателства при внедряването на AI. Като приоритизира точността на изпълнение и адаптивната обработка, Snowflake не само решава съществуващите болкови точки, но и поставя прецедент за бъдещето на индустрията. Предприятията, стремящи се да използват пълния потенциал на AI, ще се възползват изключително много от тези иновации.
За повече информация относно използването на силата на персонализирани AI решения, посетете Encorp.ai.
Референции
Martin Kuvandzhiev
CEO and Founder of Encorp.io with expertise in AI and business transformation