Googleは、「Flan-PaLM」と呼ばれる巨大言語モデルを開発した。米国医師免許試験(USMLE)形式のタスク「MedQA」で正答率67.6%を記録し、PubMedQAで79.0%を達成した。
57ジャンルの選択問題タスク「MMLU」の医療トピックでもFlan-PaLMの成績は他の巨大モデルを凌駕した。臨床知識で80.4%、専門医学で83.8%、大学生物学で88.9%、遺伝医療学で75.0%の正答率である。
https://arxiv.org/abs/2212.13138

2022年02月03日、DeepMindは自動でプログラムのコーディングが可能なAI「AlphaCode」を発表
https://www.deepmind.com/blog/competitive-programming-with-alphacode
自然言語で入力した単純なコマンドからコードを生成できる。その能力は、
競技プログラミングコンテスト「Codeforces」で過去に出題されたプログラミング課題を解くタスクで、平均ランキング上位54.3%に入る実力

AlphaCodeは問題ごとに大量のC++とPythonのプログラムを作成し、
フィルタリング・クラスタリング・ランク付けというプロセスを経て最終的に10個の候補を残すことで、絞り込んでいく