首页 >> 大全

解放生产力!用Python结合GPT-4进行编程(下)

2023-08-22 大全 25 作者:考证青年

2.与PDF文件一起工作

虽然这不是一个常见的数据科学应用案例,但有时人们不得不从数百个PDF文件中提取文本数据来建立一个情感分析模型。这些数据是非结构化的,需要花费很多时间对其进行提取和预处理。

偶尔,你可能还要与研究人员合作,阅读和创作特定行业的时事内容。需要紧跟新闻,分析公司报告,并了解该行业的潜在趋势。

阅读100页的公司报告,提取感兴趣的词,阅读包含这些关键词的句子。或者,如果对趋势感兴趣,可以创建一个自动化的工作流程来展示关键词随时间的增长,而不是手动浏览每一份报告。

在本部分中,我们将使用来分析中的PDF文件。我们将要求聊天机器人提取PDF文件的内容,并将其写入一个文本文件中。

同样,这将使用GPT-3.5和GPT-4分别来完成,以查看生成的代码是否有明显的区别。

用GPT-3.5读取PDF文件

在本部分中,将分析一份公开发布的PDF文件,标题为《工程师机器学习简介》。如果想继续编写本部分的代码,请务必下载该文件。

首先,要求算法生成代码,从这个PDF文档中提取数据并保存到一个文本文件中:

以下是该算法提供的完整代码:

import PyPDF2# 以读二进制模式打开PDF文件
with open("Intro_to_ML.pdf", "rb") as pdf_file:# 创建一个PDF阅读器对象pdf_reader = PyPDF2.PdfFileReader(pdf_file)# 获取PDF文件的总页数num_pages = pdf_reader.getNumPages()# 创建一个新的文本文件with open("output_file.txt", "w") as txt_file:# 循环浏览PDF文件中的每一页for page_num in range(num_pages):# 从当前页获取文本page_text = pdf_reader.getPage(page_num).extractText()# 把文本写到文本文件中txt_file.write(page_text)

(注意:确保将PDF文件名改为你在运行此代码前保存的文件名)。

但是,在运行GPT-3.5生成的代码后,遇到了以下错误:

回到GPT-3.5,看看该模型是否能解决这个问题:

把这个错误粘贴到上,模型回复说可以通过把使用的编码改为utf-8来解决这个问题。它还给出了一些修改过的代码,反映了这一变化:

import PyPDF2# 以读二进制模式打开PDF文件
with open("Intro_to_ML.pdf", "rb") as pdf_file:# 创建一个PDF阅读器对象pdf_reader = PyPDF2.PdfFileReader(pdf_file)# 获取PDF文件的总页数num_pages = pdf_reader.getNumPages()# 创建一个具有utf-8编码的新文本文件with open("output_file.txt", "w", encoding="utf-8") as txt_file:# 循环浏览PDF文件中的每一页for page_num in range(num_pages):# 从当前页面获取文本page_text = pdf_reader.getPage(page_num).extractText()# 把文本写到文本文件中txt_file.write(page_text)

这段代码成功执行并创建了一个名为.txt的文本文件。PDF文档中的所有内容都被写入该文件:

用GPT-4读取PDF文件

现在,把同样的提示粘贴到GPT-4中,看看该模型的结果如何:

以下是GPT-4生成的完整代码:

import PyPDF2def pdf_to_text(input_pdf, output_txt):with open(input_pdf, "rb") as pdf_file:pdf_reader = PyPDF2.PdfFileReader(pdf_file)num_pages = pdf_reader.numPagestext = ""for page_num in range(num_pages):page = pdf_reader.getPage(page_num)text += page.extractText()with open(output_txt, "w", encoding="utf-8") as text_file:text_file.write(text)input_pdf = "Intro_to_ML.pdf"
output_txt = "output_gpt4.txt"
pdf_to_text(input_pdf, output_txt)

看看这个!

与GPT-3.5不同的是,GPT-4已经指定应使用utf-8编码来打开文本文件。不需要再像以前那样回去修改代码了。

原因力结合与原因力竞合_用vi怎样进行c编程_

GPT-4提供的代码应该可以成功执行,应该可以在创建的文本文件中看到PDF文档的内容。

还有许多其他的技术可以用来实现PDF文档的自动化。如果想进一步探索,这里有一些其他的提示,可以输入:

建议在空闲时间尝试其中的一些——也许会惊讶于GPT-4可以帮助用户快速完成通常需要几个小时才能完成的琐碎任务。

3.发送自动化的电子邮件

每周在工作中花费几个小时来阅读和回复电子邮件。这不仅耗费时间,而且当赶着紧迫的截止日期时,要保持对电子邮件的掌控也是令人难以置信的压力。

虽然不能让帮忙写所有的电子邮件(当然大家都希望如此),但仍然可以用它来编写程序,在特定时间发送预定的电子邮件,或者修改一个可以发送给多人的电子邮件模板。

在这一部分中,将让GPT-3.5和GPT-4帮助编写一个脚本来发送自动电子邮件。

用GPT-3.5发送自动电子邮件

首先输入以下提示,以生成发送自动电子邮件的代码:

以下是GPT-3.5生成的完整代码(确保在运行此代码前更改电子邮件地址和密码):

import smtplib# 设置SMTP连接
smtp_server = "smtp.gmail.com"
smtp_port = 587
sender_email = "your_email@gmail.com"
sender_password = "your_password"
receiver_email = "receiver_email@example.com"with smtplib.SMTP(smtp_server, smtp_port) as smtp:# 开始 TLS 加密smtp.starttls()# 登录到你的Gmail帐户smtp.login(sender_email, sender_password)# 编写你的电子邮件信息subject = "Automated email"body = "Hello,\n\nThis is an automated email sent from Python."message = f"Subject: {subject}\n\n{body}"# 发送电子邮件smtp.sendmail(sender_email, receiver_email, message)

不幸的是,这段代码目前来看并没有成功执行。它产生了以下错误:

把这个错误粘贴到中,看看这个模型是否能帮助解决这个问题:

好的,所以该算法指出了几个原因,说明了为什么会遇到这个错误。

我知道我的登录凭证和电子邮件地址是有效的,而且代码中没有错别字。所以这些原因可以被排除。

GPT-3.5还建议,允许不太安全的应用程序可能会解决这个问题。

然而,如果你尝试这样做,你将在你的谷歌账户中找不到允许访问不太安全的应用程序的选项。

这是因为谷歌出于安全考虑,不再允许用户使用安全性较低的应用程序。

最后,GPT-3.5还提到,如果启用了双因素身份认证,应该生成一个应用程序密码。

我没有启用双因素身份认证,所以我打算(暂时)放弃这种模式,看看GPT-4是否有解决方案。

用GPT-4发送自动电子邮件

好的,所以如果你在GPT-4中输入同样的提示,你会发现该算法生成的代码与GPT-3.5给我们的非常相似。这将导致我们遇到与之前相同的错误。

看看GPT-4是否可以帮助修复这个错误:

GPT-4的建议与我们之前看到的非常相似。

然而,这一次,它为我们提供了如何完成每个步骤的分步分解。

GPT-4还建议创建一个应用程序密码,让我们尝试一下。

首先,访问你的谷歌账户,导航到“安全”,并启用双因素认证。然后,在同一个部分,你应该会看到一个选项,上面写着“应用程序密码”。

点击它,将出现以下屏幕:

可以输入任何喜欢的名字,然后点击“生成”。

将出现一个新的应用程序密码。

用这个应用程序密码替换在代码中的现有密码,然后再次运行代码:

import smtplib# 设置SMTP连接
smtp_server = "smtp.gmail.com"
smtp_port = 587
sender_email = "your_email@gmail.com"
sender_password = "YOUR_APP_PASSWORD"
receiver_email = "receiver_email@example.com"with smtplib.SMTP(smtp_server, smtp_port) as smtp:# 开始 TLS 加密smtp.starttls()# 登录到你的Gmail帐户smtp.login(sender_email, sender_password)# 编写你的电子邮件信息subject = "Automated email"body = "Hello,\n\nThis is an automated email sent from Python."message = f"Subject: {subject}\n\n{body}"# 发送电子邮件smtp.sendmail(sender_email, receiver_email, message)

这次应该能成功运行,你的收件人会收到一封类似如下的电子邮件:

很完美!

感谢,我们已经成功地用发送了一封自动电子邮件。

如果你想更进一步,我建议通过生成提示来允许你:

推荐书单 《人工智能》

本书系统地介绍了基于平台的人工智能的原理及实现过程,全书共7章。第1章“从这里开始认识”,介绍人工智能及 基础知识;第2章“ 语法基础”,通过生动有趣的实验实例介绍编程语法知识;第3章“ 程序设计”,以实例为基础,介绍 的编程方法;第4 章“数据结构”,通过范例介绍列表、元组、字典、集合、函数等数据结构的使用方法;第5章“数据库及应用”,主要介绍数据库应用及Web应用开发技术,通过实例讲解数据库应用;第6章“大数据应用”,基于实例,主要介绍网络爬虫、Excel数据爬取及分析处理等技术,了解数据挖掘分析处理等大数据应用技术的一般设计流程;第7 章“人工智能”,以具体实例讲解照片人脸识别、图像识别、视频人脸识别、聊天机器人、微信语音聊天机器人、图文识别、语音识别及花朵识别等人工智能深度学习技术。

本书图文并茂,示例丰富,讲解细致透彻,介绍深入浅出,章后练习精广,具有很强的实用性和可操作性,适合初学或自学的学生,可作为中小学STEM 教育或培训机构的人工智能课程教材,也可作为大中专院校人工智能、软件工程、计算机等专业以及相关课程的教材或参考书,还可以当作全国计算机二级()考试的教材使用。

《人工智能》(刘伟善)【摘要 书评 试读】- 京东图书京东JD.COM图书频道为您提供《人工智能》在线选购,本书作者:,出版社:清华大学出版社。买图书,到京东。网购图书,享受最低优惠折扣!

精彩回顾

《如虎添翼,6个让你效率翻倍的插件》

《还没搞懂GPT-4,就来了!一文帮你速通》

《大模型技术的根基,解读注意力机制论文《 Is All You Need》和代码实现(下)》

《大模型技术的根基,解读注意力机制论文《 Is All You Need》和代码实现(上)》

《真实对比, 与谷歌Bard大比拼》

《深入浅析,一步步用GPT打造你的聊天机器人》

微信搜索关注《学研大本营》,加入读者群

访问【IT今日热榜】,发现每日技术热点

关于我们

最火推荐

小编推荐

联系我们


版权声明:本站内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 88@qq.com 举报,一经查实,本站将立刻删除。备案号:桂ICP备2021009421号
Powered By Z-BlogPHP.
复制成功
微信号:
我知道了