一次诡异的docker错误调试
源自小伙伴的求助,虽然没能定位到最终的原因,调试的过程也比较有意思
缘起
小伙伴求助我,同一个docker镜像在测试机器上可以运行,在阿里云上运行提示用户不存在。
在阿里云上运行提示如下:
# docker run --rm -it image:tag docker: Error response from daemon: linux spec user: unable to find user www-data: no matching entries in passwd file. ERRO[0000] error waiting for container: context canceled
- 镜像名称统一使用image:tag代替,其实错误和镜像的关系不大
- 从错误描述看:应该是在
/etc/passwd
中未能找到www-data
这个用户,判断用户不存在
调试过程
换成用root
启动,依然提示找不到用户
# docker run --rm -it --user root image:tag docker: Error response from daemon: linux spec user: unable to find user root: no matching entries in passwd file.
- 看来
root
也要在/etc/passwd
里面找
换一种方式启动,错误提示变了
# docker run --rm -it --user $(id -u) image:tag docker: Error response from daemon: OCI runtime create failed: container_linux.go:348: starting container process caused "exec: \"docker-php-entrypoint\": executable file not found in $PATH": unknown.
- 看来镜像设置有entrypoint
- 但是为什么找不到entrypoint
换一个entrypoint试试看
# docker run --rm -it --user $(id -u) --entrypoint 'ls' image:tag docker: Error response from daemon: OCI runtime create failed: container_linux.go:348: starting container process caused "exec: \"ls\": executable file not found in $PATH": unknown.
ls
也找不到?那用/bin/ls
试试看
# docker run --rm -it --user $(id -u) --entrypoint '/bin/ls' image:tag docker: Error response from daemon: OCI runtime create failed: container_linux.go:348: starting container process caused "exec: \"/bin/ls\": stat /bin/ls: no such file or directory": unknown.
- 这次错误提示换了,找不到
/bin/ls
- 怀疑是文件系统错误,整个
/
下的文件都找不到
把/bin/ls
挂载到容器内试试
# docker run --rm -it --user $(id -u) -v '/bin/ls':'/bin/ls' --entrypoint '/bin/ls' image:tag standard_init_linux.go:190: exec user process caused "no such file or directory"
- 基本可以确定是docker内文件系统挂了
山穷水尽
暂时没找到办法进一步的追踪。通过docker inspect
和docker history
均看不出镜像的异常。
通过docker logs
也看不到容器启动中的其他错误。
柳暗花明
别的小伙伴帮忙找到了这个issue: Error response from daemon: OCI runtime create failed - when running a Node.js Docker image
虽然错误类型不太一致,发现我一直忘记查看docker daemon的日志!!!!
通过journalctl -fu docker.service
查看错误日志,发现和issue中的错误一致。
... level=error msg="stream copy error: reading from a closed fifo"
可能是docker的一个未修复的BUG。
TODO
为何--user root
时会查找passwd
文件,--user $(id -u)
可以跳过passwd
文件
相关推荐
yangkang 2020-09-10
王道革 2020-11-25
bwyyziq 2020-11-22
pigsmall 2020-11-19
changecan 2020-11-19
helloWorldAndYou 2020-11-16
nginxs 2020-11-14
红石丶 2020-11-13
WanKaShing 2020-11-12
yangkang 2020-11-12
滴水穿石点石成金 2020-11-12
张荣珍 2020-11-12
wuxunanjing 2020-11-11
魅惑青花瓷 2020-11-11
lihongtai 2020-11-09
yangkang 2020-11-09
worldsnow 2020-11-06
MichaelJScofield 2020-11-06