banner
ニュース センター
優れた入力、厳格な品質保証。

Datasaur を使用すると、一連のラベルからモデルを自動的に構築できます

Jun 04, 2023

ChatGPT や生成 AI について人々が話題にするずっと前から、Datasaur のような企業は機械学習モデルの構築の基本に取り組んでおり、モデルをトレーニングするためのラベル付けを支援していました。 AI の普及に伴い、この種の機能の重要性はさらに高まっています。

データ サイエンスの専門家がいないより多くの企業にモデル構築を提供するために、Datasaur は、ラベル データから直接モデルを作成できる機能を発表し、技術者がはるかに少ないユーザーでもモデルを作成できるようにしました。 また、昨年12月に終了した400万ドルのシード延長も発表した。

同社の創設者アイヴァン・リー氏は、最近のAIへの関心の高まりは同社にとって素晴らしいものであり、実際にスタートアップの戦略にうまく機能していると述べた。 「Datasaur が常に目指してきたのは、LLM、従来の NER モデル、感情分析など、モデルにフィードする必要があるトレーニング データを収集する最適な場所です」と Lee 氏は TechCrunch に語った。

「私たちは、技術者以外のユーザーがアクセスしてデータにラベルを付けるための最良のインターフェースにすぎません」と彼は言いました。

LLM の台頭は、AI がビジネスの場面でどのように役立つかについての一般的な認識を高めるのに役立っていますが、ほとんどの企業はまだ模索段階にあり、モデルを構築するには Datasaur のような製品が依然として必要であると彼は言います。 Lee 氏は、当初からの目標の 1 つは、特に自然言語処理に関して AI を民主化することであり、新しいモデル構築機能により、専門知識を持たない企業であっても AI をより多くの企業が利用できるようになると述べています。

「そして、この機能は私が特に興奮している機能の 1 つです。なぜなら、データ サイエンティストもエンジニアもいないチームでも、このデータを適切と思われる方法でマークアップしてラベルを付けるだけで、自動的にモデルをトレーニングできるからです」と Lee 氏は述べています。 。

Lee 氏は、これがデータ サイエンティストの当初のターゲット市場を超えて進む方法であると考えています。 「今後、建設会社、法律事務所、マーケティング会社など、データ エンジニアリングの経験がなくても(トレーニング データに基づいて) NLP モデルを構築できるように、これを開放していきます。」

同氏は、無駄のない経営を行っているため、これまでのベンチャー投資額を抑えることができたと語る(前回のシード額は2020年時点で390万ドルと控えめだった)。 彼のエンジニアリング チームはほとんどがインドネシアにおり、採用を予定している一方で、効率的な方法で会社を運営することに誇りを持っています。

「私の哲学は常に収益性であり、拡張可能な方法で成長することであり、いかなる犠牲を払ってでも成長することはない」とリー氏は語った。 つまり、彼はすべての採用と、それがビジネスに与える影響を考慮しているということです。

リモートで異文化の労働力を擁することで、従業員は互いに学び合うことができ、それが会社の性質上多様性をもたらします。 「米国とインドネシアの職場文化には大きな違いがあります。 したがって、1 つは、両方の長所を意図的に取り入れる必要があるということです」と彼は言いました。 それは、インドネシア人の同僚に発言を奨励したり、マネージャーの発言を押し返したりすることを意味する可能性があるが、これは彼らが文化的に嫌がることだ。 「私たちはそれを奨励することに非常に積極的に取り組んできました」と彼は言いました。

しかし、同僚への敬意やチームを第一に考える文化など、アジアでの物事の進め方についても米国の従業員が学ぶべきことがたくさんあると彼は言い、チームがこうした文化の違いを乗り越えられるよう手助けする必要があったと述べた。

400万ドルの投資はInitialized Capitalが主導し、HNVR、Gold House Ventures、TenOneTenが参加した。 同社は総額790万ドルを調達した。