ログアウト
donwloadimg

アプリをダウンロード

ログイン後利用可能
トップに戻る
Sam Altman returns as OpenAI CEO after days of infighting at AI startup
閲覧 192K コンテンツ 47

人類の生存を脅かす? ! OpenAIの謎の突破口「Q*」とは何ですか?

人類の生存を脅かす? ! OpenAIの謎の突破口「Q*」とは何ですか?
$マイクロソフト(MSFT.US)$OpenAI内部のドラマは終わったかもしれませんが、解決していない問題がたくさん残っています。最も重要なのは、元CEOのOatmanを解雇することです。
以前、OpenAIのCTOであるMira Muratiは、社員向けの内部文書で「Q *」というプロジェクトについて言及し、Oatman氏についての評議会の不満の一つの要因として引用しています。
Q * とは何ですか?
Q *に関する詳細な情報は現在OpenAI内部に漏れていません。
一部の業種関係者の推測によると、Q -Learningと呼ばれる機械学習アルゴリズムと同義である可能性があります。新しいモデルをQ-Learningを使用して構築するためのコードネームである可能性があり、または別のプロジェクト名である可能性があります。
人類の生存を脅かす? ! OpenAIの謎の突破口「Q*」とは何ですか?
本質的に、Q-Learningは、全ての可能な経路を探って期待される報酬への最短経路を学び、時間の経過とともに意思決定を最適化するアルゴリズムです。
報道によると、Oatman氏の解雇前にOpenAIはQ *を内部でデモンストレーションしており、初等レベルの数学問題を解く能力を示しています。
基本的な数学問題を解くことは非常に特別なことではないかもしれませんが、テックブログPC Guideは、OpenAIが使用するQ *がベルマン方程式の最適値関数を参照する可能性があることを指摘しています。言い換えると、Q *は効率最適化アルゴリズムの最適な解を見つけたり、接近したりするOpenAIの可能性を示し、人工汎用インテリジェンス(AGI)を実現するための重要な一歩を示しています。
Q*の可能性のある影響は何ですか?人工汎用知能(AGI)の達成。.
Q *の潜在的な影響とは何ですか?
現在、OpenAIはQ *に関する一連の質問に回答していません。
OpenAIが5月に発表した最新の研究によると、トレーニング方法を調整し、大規模な教師付きデータを導入することで、強化学習システムの数学的な推論能力を大幅に向上させることができます。また、プロセス志向の強化学習監督の導入により、大規模なモデルのデータ推論および計算の正確性がさらに向上します。
アナリストの推測によると、Q*などの強化学習と決定アルゴリズムの進歩は、GPT-4のような大規模モデルの能力の飛躍的な向上につながる可能性があります。強化学習と決定アルゴリズムの統合により、より強力な人工知能エージェントの能力が得られるかもしれません。
免責事項:このコミュニティは、Moomoo Technologies Inc.が教育目的でのみ提供するものです。 さらに詳しい情報
4
1
+0
1
原文を見る
報告
138K 回閲覧
コメント
サインインコメントをする