Модуль Grafana продолжает перезапускаться после установки Helm

У меня есть чистый кластер AKS, на котором я развернул диаграмму прометея-оператора. Модуль Grafana показывает множество перезапусков. Моя версия кластера - 1.11.3. Журналы Grafana ниже. Кто-нибудь еще сталкивается с этой проблемой?

File in configmap grafana-dashboard-k8s-node-rsrc-use.json ADDED
Traceback (most recent call last):
  File "/usr/local/lib/python3.6/site-packages/urllib3/response.py", line 543, in _update_chunk_length
    self.chunk_left = int(line, 16)
ValueError: invalid literal for int() with base 16: b''
 During handling of the above exception, another exception occurred:
 Traceback (most recent call last):
  File "/usr/local/lib/python3.6/site-packages/urllib3/response.py", line 302, in _error_catcher
    yield
  File "/usr/local/lib/python3.6/site-packages/urllib3/response.py", line 598, in read_chunked
    self._update_chunk_length()
  File "/usr/local/lib/python3.6/site-packages/urllib3/response.py", line 547, in _update_chunk_length
    raise httplib.IncompleteRead(line)
http.client.IncompleteRead: IncompleteRead(0 bytes read)
 During handling of the above exception, another exception occurred:
 Traceback (most recent call last):
  File "/app/sidecar.py", line 58, in <module>
    main()
  File "/app/sidecar.py", line 54, in main
    watchForChanges(label, targetFolder)
  File "/app/sidecar.py", line 23, in watchForChanges
    for event in w.stream(v1.list_config_map_for_all_namespaces):
  File "/usr/local/lib/python3.6/site-packages/kubernetes/watch/watch.py", line 124, in stream
    for line in iter_resp_lines(resp):
  File "/usr/local/lib/python3.6/site-packages/kubernetes/watch/watch.py", line 45, in iter_resp_lines
    for seg in resp.read_chunked(decode_content=False):
  File "/usr/local/lib/python3.6/site-packages/urllib3/response.py", line 626, in read_chunked
    self._original_response.close()
  File "/usr/local/lib/python3.6/contextlib.py", line 99, in __exit__
    self.gen.throw(type, value, traceback)
  File "/usr/local/lib/python3.6/site-packages/urllib3/response.py", line 320, in _error_catcher
    raise ProtocolError('Connection broken: %r' % e, e)
urllib3.exceptions.ProtocolError: ('Connection broken: IncompleteRead(0 bytes read)', IncompleteRead(0 bytes read))

person Jerry Joyce    schedule 09.11.2018    source источник
comment
Похоже, у вас есть коляска на питоне. У вас есть определение развертывания / модуля для графаны?   -  person Rico    schedule 10.11.2018
comment
Да, в капсуле три контейнера. kiwigrid / k8s-коляска: 0.0.3 kiwigrid / k8s-sidecar: 0.0.3 grafana / grafana: 5.3.1   -  person Jerry Joyce    schedule 12.11.2018
comment
Что вы использовали для установки? у гида, за которым я следил, нет коляски   -  person Rico    schedule 12.11.2018
comment
helm install stable / prometheus-operator   -  person Jerry Joyce    schedule 13.11.2018


Ответы (2)


На основе репозитория операторов Prometheus ... Контейнер sidecar на модуле Grafana не может связаться с Grafana и перезагрузить / обновить информационные панели, определенные на наблюдаемой карте конфигурации.

Итак, это симптом сбоя контейнера Grafana ... можете ли вы проверить контейнер Grafana в журналах вашего модуля Grafana?

person Carlos Gomez    schedule 11.11.2018
comment
Журналы для контейнера Grafana выглядят нормально, и я могу просматривать панели мониторинга в браузере. Перезагрузка пода также выровнялась. Их было 280 за первые 12 часов или около того, а с тех пор ни одного. Панель управления, похоже, работает, но немного беспокоит то, что я все еще вижу сбои в журналах для контейнеров с коляской, как в исходном вопросе. - person Jerry Joyce; 12.11.2018

Это можно исправить, обновив контейнер с коляской до более новой версии, поскольку это известная ошибка, которая исправлена.

person Rick Rackow    schedule 11.07.2019