OpenAI는 일반적인 생물학 워크플로에 대해 특별히 훈련된 GPT-Rosalind라는 대규모 언어 모델의 개발을 발표했습니다. 생물학자 로절린드 프랭클린(Rosalind Franklin)의 이름을 딴 이 모델은 생물학적 데이터 분석에 대한 전문적인 접근 방식을 나타내며, 주요 기술 회사에서 일반적으로 사용하는 보다 일반적인 모델과 구별됩니다.
OpenAI의 생명 과학 제품 책임자인 Yunyun Wang은 GPT-Rosalind가 생물학 연구의 중요한 장애물을 해결한다고 말했습니다. 첫 번째 과제는 수십 년 동안의 게놈 서열 분석과 단백질 생화학을 통해 생성된 방대한 데이터 세트에서 발생합니다. 두 번째 과제는 생물학의 많은 하위 분야를 전문화하는 것과 관련이 있으며, 각 하위 분야는 고유한 기술과 특정 전문 용어로 특징지어집니다.
예를 들어, 유전학자들은 뇌 세포에서 활동하는 특정 유전자와 관련된 광범위한 신경생물학적 문헌을 탐색하는 데 어려움을 겪을 수 있습니다. Wang은 OpenAI가 GPT-Rosalind에게 가장 일반적인 생물학적 작업 흐름 50개와 생물학적 정보의 주요 공공 데이터베이스 액세스에 대해 교육했다고 언급했습니다.
이 모델은 잠재적인 생물학적 경로를 제안하고 약물 표적의 우선순위를 정하는 기능을 갖추고 있습니다. Wang은 “우리는 알려진 경로와 조절 메커니즘을 통해 유전자형을 표현형에 연결하고 단백질의 구조적 또는 기능적 특성을 추론하고 실제로 이러한 기계적 이해를 활용하고 있습니다”라고 말했습니다.
<시간 />








