ChatGPT in Drug Discovery

2023-08-14 大全 31 作者：考证青年

是开发的一种语言模型。这是一个在大型人类语言数据集上训练的机器学习模型，能够生成类似人类语言文本。它可以用于各种自然语言处理任务，如语言翻译、文本摘要和问题回答。在目前的工作中，我们讨论了在药物发现中的应用。

1 药物发现是一个非常困难和复杂的过程，原因如下: 生物复杂性:人体是一个极其复杂的系统，在分子水平上理解它是如何工作的是困难的。疾病是由多种因素引起的，寻找一种能够有效治疗疾病的药物是具有挑战性的;失败率高:大多数进入临床试验的药物都没有获得批准。这是因为它们在测试过程中被发现无效，或者有不可接受的副作用;耗时昂贵:药物发现过程漫长且成本高昂。严格的监管要求:药物开发过程受到严格监管，药物必须经过一系列临床前和临床试验，才能被批准使用;(5)药物开发的不可预测性:即使一种药物已经被确定并开发出来，也不能确定它在人体试验中是否会像预期的那样起作用，有时它可能会产生意想不到的副作用;缺乏新的靶点:许多已知的药物靶点已经被利用，寻找新的靶点变得越来越困难。尽管面临这些挑战，研究人员仍在继续努力开发新的有效药物。 2 实验设计

设计了以下可应用于计算药物发现过程的计算问题：

计算复合多样性:当问Zn的多样性时，GPT给出了正确的答案。Chat GPT的答案如下:“锌是一种原子序数为30的过渡金属，它的电子构型中有30个电子。Zn的电子构型为[Ar] 3d^10 4s^2。由于所有的电子在轨道上都是成对的，所以Zn的多样性为1(单线态)。这意味着HOMO中的所有电子都是成对的，分子中没有未成对的电子。”因此，Chat GPT可以用于密度泛函理论(DFT)量子力学计算中确定各种化合物的多重性；将转换为文件： Chat GPT成功地确定了（）的，因此它可以用来将一种文件格式转换为另一种。Chat GPT的答案是：“ 的化学名称是，其分子式是，的简化分子输入行系统（）符号是 “CC（=O）NC1=CC=C（C=C1）O”。这个符号代表了分子中的原子和它们的联系”；生成和其他软件的输入文件:Chat GPT成功生成高斯软件的输入文件；生成对接的输入文件:成功地提供了软件的输入文件，并解释了其中提到的参数；查找pdb文件:可用于搜索pdb。例如，它可以提供金属蛋白、DNA结合蛋白、刺突蛋白等的PDB id；在文献检索方面的帮助:的一个主要应用是在文献检索和列出与主题相关的具体发现；对接代码:它可以帮助编写基本代码，这些代码可以在药物发现的许多方面广泛使用(稍加修改)；检查剽窃:可以用来检测剽窃，使研究过程和发表的研究工作顺利进行；机器学习和数据分析:它可以使用其API集成到程序或应用程序中，允许开发人员输入文本并接收由模型生成的响应。可以使用、和c#等编程语言访问API。此外，团队还发布了该模型的预训练版本，可以使用称为迁移学习的过程对特定任务进行微调；写一首关于计算化学的诗: 也可以写一首与计算化学相关的诗；创新:创新是研究领域的重要组成部分，只有提出不同的问题才能做到这一点。在这方面，对于研究人员提出新颖的想法非常有用。

Chat GPT无法回答以下复杂的问题：

Zinc 的PDB ID列表；锌离子通道的PDB ID；可以给出FASTA序列，但不能比较FASTA序列，fasta序列可以从数据库中获得；ADMET性质:在这种情况下，它只能给出已知药物的性质，这些性质可以很容易地从各种药物数据库中获得。

在药物发现中的前景：

识别和验证新的药物靶点:可以在科学文献的数据集上进行微调，并用于生成针对特定疾病或生物靶点的最新研究摘要。这可以帮助研究人员快速确定新的潜在目标，或者更好地了解特定领域的研究现状；设计新药:可以在已知类药物分子的数据集上进行微调，并用于产生具有类似性质的新化学结构。这可以帮助研究人员确定新的先导化合物，这些化合物在临床前和临床研究中有更高的成功机会；优化药物性质:可用于预测新药的药代动力学和药效学，支持药物发现早期化学物库的虚拟筛选;评估毒性:可以在毒性数据集上进行微调，并用于预测新药的潜在毒性作用;生成与药物相关的报告和论文:可以在与药物相关的论文数据集上进行微调，并用于生成总结特定领域研究现状的报告和论文。可以在已知类药物分子的数据集上进行微调，并用于生成具有类似性质的新化学结构。这可以帮助研究人员确定新的先导化合物，这些化合物在临床前和临床研究中有更高的成功机会。

虽然它有各种优点，但它不能进行广泛的科学计算，如计算RMSD, RMSF, PCA，聚类等。对于这些复杂的工作，需要训练有素和经验丰富的人员参与。需要注意的是，只是用于药物发现的众多工具中的一种，它不能替代实验验证和临床试验。然而，它可以通过提供一种经济有效的方法来处理大量数据并产生新知识，从而显著加快和改善药物开发过程。

虽然可以成为药物发现的强大工具，但使用这项技术也存在一些潜在的缺点:

依赖于数据的质量和可用性:的质量取决于它所接受的训练数据。如果数据不完整、有偏差或不准确，模型的预测可能不可靠。缺乏实验验证:可以产生预测和假设，但它不能进行实验或测量化合物的性质。因此，该模型的预测需要实验验证。对潜在生物学的理解有限:虽然可以生成类似人类的文本，但它并不理解它所模拟的系统的潜在生物学。因此，由模型做出的预测可能并不总是反映系统的真实复杂性。有限的可解释性:像其他机器学习模型一样，很难解释，而且模型如何得出特定的预测并不总是很清楚。在处理不确定性方面的限制:是一个确定性模型，它不能解释数据和预测中的不确定性。缺乏透明度:是一个黑箱模型，很难理解和解释模型的内部工作原理，这使得很难信任模型的预测.

在使用进行药物发现和实验验证模型所做的预测时，重要的是要记住这些限制，并将其与其他工具和技术结合使用以克服这些限制。

tags: 预测模型药品

ChatGPT in Drug Discovery

头条项目推荐的相关技术(七)：离线排序模型训练与在线计算

预测模型，怎么做才够精准

药品销售管理系统

银杏果能吃吗路边的银杏果可以吃吗

基于kaggle欧洲国家太阳能发电数据集的太阳能站点效率预测

基于随机森林的煤与瓦斯突出预测方法研究

利用区块链等技术，加强对交通运输信用信息的归集共享和分析应用

印尼西爪哇梳邦县发生山体滑坡已经导致2人死亡

【SpringBoot笔记10】Spring中Bean的6种作用域

ARS548 ARS549RDI 80GHZ毫米波雷达达学习笔记（一)

叠氮PEG修饰二硒化钨 (N3-WSe2；azide

ATFX：黑海运粮遭俄暂停，小麦期货开盘跳涨

关于我们

最火推荐

小编推荐

联系我们

复制成功

ChatGPT in Drug Discovery

头条项目推荐的相关技术(七)： 离线排序模型训练与在线计算

预测模型，怎么做才够精准

药品销售管理系统

银杏果能吃吗 路边的银杏果可以吃吗

基于kaggle欧洲国家太阳能发电数据集的太阳能站点效率预测

基于随机森林的煤与瓦斯突出预测方法研究

利用区块链等技术，加强对交通运输信用信息的归集共享和分析应用

印尼西爪哇梳邦县发生山体滑坡 已经导致2人死亡

【SpringBoot笔记10】Spring中Bean的6种作用域

ARS548 ARS549RDI 80GHZ毫米波雷达达学习笔记（一)

叠氮PEG修饰二硒化钨 (N3-WSe2；azide

ATFX：黑海运粮遭俄暂停，小麦期货开盘跳涨

关于我们

最火推荐

小编推荐

联系我们

复制成功

头条项目推荐的相关技术(七)：离线排序模型训练与在线计算

银杏果能吃吗路边的银杏果可以吃吗

印尼西爪哇梳邦县发生山体滑坡已经导致2人死亡