Les technologies Cloud et cloud-natif sont devenues les piliers de l'Internet moderne. Les utilisateurs et les organisations s'appuient désormais sur des applications cloud pour leurs besoins quotidiens. Cependant, les pannes et les dégradations de la qualité de service peuvent avoir des impacts désastreux sur notre société. De plus, les applications Web sont devenues des systèmes distribués complexes, difficiles à comprendre et à exploiter, donc plus sujettes aux pannes si elles ne sont pas gérées en conséquence. Par conséquent, il est primordial de comprendre, d'observer, de prévenir, de détecter et de corriger tout problème pouvant entraîner des défaillances.Dans cette thèse, nous proposons un cadre pour atteindre l'observabilité dans le...