记录一下在客户现场遇到的一个docker服务问题

之前启动的docker服务,运行一段时间后,部分服务让杀掉,并且通过docker-compose无法重启成功,查看docker服务日志,报错 stream copy error: reading from a closed fifo

排查过程:

1.初步定位是内存不够了,用 free -g 查看发现内容是够的
在这里插入图片描述
2.上网搜了一下,有的博主说是重启docker可以解决,重启docker后发现错误发生变化,之前没起来的服务还起不来,错误变成 Failed to allocate network resources for node *****
3.docker服务的网络是默认的,不考虑docker网络的问题,更换stack名字重启依旧不行
4.docker service ps ID/docker service logs ID查看未成功启动服务日志,发现错误日志依旧是 stream copy error: reading from a closed fifo
5.最后重启服务器之前,用 df -h 命令看了一下磁盘,发现/dev/mapper/centosroot磁盘满了
在这里插入图片描述

解决方法:

进入到cd /var/log删除一些无用的日志文件,如果当前日志文件较少,可以在根目录利用du -sh查看那些文件夹占的空间大,一般/var文件夹和/root文件夹会占用根磁盘,需要删除这两个文件夹内容

Refer to StackOverflow: docker : Error response from daemon: OCI runtime create failed: unable to retrieve OCI runtime error To check the issue by run docker in the debug mode. 1: stop docker with systemctl stop docker 2: run docker in debug mode docker d -
docker : Error response from daemon: OCI runtime create failed: container_ linux .go:346: start ing container process cau sed "exec: \"sh\": executable file not found in $PATH": unknown. 环境:Ubuntu16.04 INFO[2020-05-19T17:36:59.658945940+08:00] shim reaped id=19544c36eb40661bae26d559d0061e9616addbde74c9dcee13978f8568b6e1fd ERRO[2020-05-19T17:36:59.670228708+08:00] stream copy error : read ing f...
上一篇讲解了nvidia- docker 中关于nvidia- docker 的部署以及一些我遇到的相应错误总结,但最后并没有演示 容器 开启后的应用与步骤,因为其实我自己也有点不清楚到底做的是个什么东西,但所幸看起来是成功了。 nvidia- docker 部署 在默认已经部署成功的时候,我们可以通过下面几条命令看当前nvidia- docker 状态是否开启成功: // An highlighted block var foo = 'bar'; containerd: time="2019-12-19T21:50:49.070815105Z" level=info msg="shim reaped" id=6bdd3fe50ae41e731e7483e939612792d6c752ca0437525dc89103abacf22a8d docker d: time="20...
在高速数据采集系统中,若A/D转换器直接与微处理器MCU相接,则因高速A/D的转换速率较高,迫使MCU不断地读取转换结果,因而就占用了MCU大部分的I/O带宽,降低了MCU的工作效率。        在此情况下通常都会加缓存器,这样“模/数转换器缓存器一处理器”就成为一种通用模式。下面就介绍如何利用 FIFO 芯片CY7C4255V实现高速高精度模/数转换器AD767l与LPC2200系列ARM处理器的接口。        1 器件简介        1.1 模/数转换器AD7671            AD767l是采样速率达1Msps的16位逐次逼近型高速高精度模/数转换器,采用
摘要:在采用CCD对非透明薄板厚度的测量系统设计中,采用高速A/D和DSP等器件进行电路设计可以确定CCD的像点位置。由于A/D转换器的采样速率和DSP的工作时钟频率相差非常大,为了提高DSP的工作效率,避免数据丢失和控制方便,采用小容量的 FIFO 作为两者之间的接口可以产生很好的效果。 关键词:A/D;DSP; FIFO 1 前言在使用CCD对非透明薄板厚度的测量系统设计中,笔者采用高速A/D和DSP等器件设计信号采集和处理电路来确定CCD的像点位置。其具体电路如图1所示,该信号采集和处理电路由CCD驱动电路、加法电路、滤波放大等信号预处理电路、A/D转换电路、FIFO、DSP电路、时序与逻
NVIDIA深度学习GPU训练系统(又名DIGITS)是用于训练深度学习模型的Web应用程序。它将深度学习的力量交到了工程师和数据科学家手中。它可用于快速训练用于图像分类,分割和目标检测任务的高精度深度神经网络(DNN)。当前受支持的框架为:Caffe,Torch和Tensorflow。 nvidia- docker 部署使用 首先是需要cuda以及cuda对应的gcc、g+等依赖,目前19年的gcc为8.3.1,cuda是向上兼容,所以如果显卡驱动只需要最低版本高于上表cuda接受的最低版本 问题 排查 过程,源码部分均由我的开发同事 排查 和记录;在征得其同意后,由我发表在此。 二、 问题 某天接到客户反馈,pod的事件中出现大量的 warn ing event: Read iness probe failed: OCI runtime exec failed: exec failed: EOF: unknown。但不影响客户访问该服务。 特别说明:客户在负责运行业务的k8s节点上坚持开启了cpu-manager
通过OCP集群创建Hitchhiker时有时启动失败 容器 显示事件信息:Pod sandbox changed, it will be killed and re-created.。如图所示: 出现该 问题 的现象是:在当前namespace下创建第一个Hitchhiker可以正常启动( 容器 参数:1c/2G),当相同配置又创建一个后第二个启动之后K8s 主动 kill掉该 容器 然后事件信息显示上面的信息...
在Systemd出现之前, Linux 系统及各应用的日志都是分别管理的,Systemd开始统一管理了所有Unit的启动日志,这样带来的好处就是可以只用一个 journalctl命令,查看所有内核和应用的日志。 journalctl 常用命令介绍 [root@node01 ~]# journalctl --help journalctl [OPTIONS...] [MATCHES...] 1. 以root用户身份运行FreeSWITCH:使用sudo命令或切换到root用户,并再次尝试启动FreeSWITCH。 2. 修改权限:尝试更改相关文件或目录的权限,以允许当前用户或FreeSWITCH进程具有足够的权限。您可以使用chmod命令来更改权限。 例如,使用以下命令将文件/目录的所有者设置为当前用户: sudo chown -R your_username:your_username /path/to/file_or_directory 3. 修改调度程序策略:尝试更改调度程序策略为其他可用的策略,如SCHED_OTHER或SCHED_RR。您可以在FreeSWITCH的配置文件中进行相应更改。 请尝试上述解决方法,并告诉我是否有所帮助。如果 问题 仍然存在,请提供更多详细的错误信息,以便我能够给出更准确的建议。