text-generation-webui大模型部署,Text-Generation WebUI大模型部署实践指南

马肤

温馨提示:这篇文章已超过449天没有更新,请注意相关的内容是否还可用!

摘要:本项目的目标是部署一个名为"text-generation-webui"的大型自然语言处理模型。该模型具备强大的文本生成能力,并通过Web界面提供用户交互功能。部署过程涉及模型的集成和优化,以确保在Web环境下高效运行。项目将为用户提供便捷的文本生成服务,并推动自然语言处理技术在Web应用中的发展。

1 简介

text-generation-webui是一个功能强大的大模型部署UI,提供了众多便于交互的接口,安装部署后,只需将模型放置到指定位置即可在网页上访问,若是在服务器部署,也可以通过SSH隧道转发至公网服务器进行访问,模型的下载可以参考相关教程,比较有效的方法包括使用镜像网站和下载脚本进行下载,或者直接在浏览器中下载后上传至服务器。

2 安装

1 官方安装

从本地库下载text-generation-webui。

text-generation-webui大模型部署,Text-Generation WebUI大模型部署实践指南 第1张 (图片来源网络,侵删)

使用git clone命令克隆官方仓库:

git clone https://github.com/oobabooga/text-generation-webui.git

然后进入相应文件夹,按照官方教程进行安装,主要根据系统类型、是否支持AVX指令集以及是否使用GPU来选择相应的安装配置。

2 自定义安装

2.1 环境

为避免使用官方的一键安装脚本(因为它会下载新的conda并创建一个新环境,且下载过程可能较慢),可以选择自定义安装环境,首先激活现有的conda环境,并根据平台安装pytorch,如果使用GPU,则需要安装cuda版本并安装相关库,这里不再赘述,根据GPU与CPU选择合适的依赖文件,例如对于不支持AVX2指令集但支持NVIDIA GPU的环境,可以选择使用requirements_noavx2.txt文件,并使用清华源进行加速安装。

pip install -r requirements_noavx2.txt -i https://pypi.tuna.tsinghua.edu.cn/simple

注意:使用AVX2指令集时可能会遇到模型部署推理阶段的错误,如Illegal instruction (core dumped) error,在这种情况下,建议重新下载对应的包解决问题。

2.2 模型

按照示例结构放置模型文件,对于量化后的gguf模型,可以直接放置;但使用Q4量化的模型时可能会遇到AttributeError问题,推荐使用Q5及以上的版本,原始的模型需要放在特定的文件夹结构下,每个子文件夹包含一个模型的全部文件,在text-generation-webui的模型读取中,有多种模式可供选择,可根据实际情况进行选择,针对某些平台,可能需要安装特定的库如llama-cpp-python,在特定平台(如linux/arm64)安装时可能会遇到一些错误,可以尝试升级gcc或使用特定版本的安装包解决。

3 部署

1 启动

在相应目录下启动server.py文件,此时应能在localhost:7860访问Web UI。

python server.py

2 autossh转发

若服务器部署在内网,访问不便,可通过SSH隧道进行转发,安装autossh后,在服务器上运行以下命令将本地端口转发到公网服务器的端口上,个人电脑即可通过公网IP和端口访问Web UI,参数解释及注意事项已在文中详细描述。

autossh -M 4010 -NR 80:localhost:7860 username@xxx.xxx.xxx.xxx (-p xxxx)

0
收藏0
文章版权声明:除非注明,否则均为VPS857原创文章,转载或复制请以超链接形式并注明出处。

相关阅读

  • 【研发日记】Matlab/Simulink自动生成代码(二)——五种选择结构实现方法,Matlab/Simulink自动生成代码的五种选择结构实现方法(二),Matlab/Simulink自动生成代码的五种选择结构实现方法详解(二)
  • 超级好用的C++实用库之跨平台实用方法,跨平台实用方法的C++实用库超好用指南,C++跨平台实用库使用指南,超好用实用方法集合,C++跨平台实用库超好用指南,方法与技巧集合
  • 【动态规划】斐波那契数列模型(C++),斐波那契数列模型(C++实现与动态规划解析),斐波那契数列模型解析与C++实现(动态规划)
  • 【C++】,string类底层的模拟实现,C++中string类的模拟底层实现探究
  • uniapp 小程序实现微信授权登录(前端和后端),Uniapp小程序实现微信授权登录全流程(前端后端全攻略),Uniapp小程序微信授权登录全流程攻略,前端后端全指南
  • Vue脚手架的安装(保姆级教程),Vue脚手架保姆级安装教程,Vue脚手架保姆级安装指南,Vue脚手架保姆级安装指南,从零开始教你如何安装Vue脚手架
  • 如何在树莓派 Raspberry Pi中本地部署一个web站点并实现无公网IP远程访问,树莓派上本地部署Web站点及无公网IP远程访问指南,树莓派部署Web站点及无公网IP远程访问指南,本地部署与远程访问实践,树莓派部署Web站点及无公网IP远程访问实践指南,树莓派部署Web站点及无公网IP远程访问实践指南,本地部署与远程访问详解,树莓派部署Web站点及无公网IP远程访问实践详解,本地部署与远程访问指南,树莓派部署Web站点及无公网IP远程访问实践详解,本地部署与远程访问指南。
  • vue2技术栈实现AI问答机器人功能(流式与非流式两种接口方法),Vue2技术栈实现AI问答机器人功能,流式与非流式接口方法探究,Vue2技术栈实现AI问答机器人功能,流式与非流式接口方法详解
  • 发表评论

    快捷回复:表情:
    评论列表 (暂无评论,0人围观)

    还没有评论,来说两句吧...

    目录[+]

    取消
    微信二维码
    微信二维码
    支付宝二维码