Service health incident: Potíže s přístupem k obsahu

S

Jako SP197263 , resp. OD197264 publikoval Microsoft 3. prosince v 17:35 hodin informaci o potížích s přístupem k webu SharePoint, resp. obsahu OneDrive for Business s uvedením začátku potíží v 17:11 hodin.

AKTUÁLNÍ INFORMACE K ŘEŠENÍ

Datum, ČasInformace
11.12.2019 00:50Všechna nastavení omezující provoz byla odebrána, veškerý provoz je plně funkční. Problém je vyřešen.
10.12.2019 20:55Probíhá odebírání předchozí konfigurace omezující určitý typ provozu a monitoring stavu služeb.
10.12.2019 18:38Monitoring ukazuje zdravý stav služeb.
10.12.2019 14:01Telemetrická data potvrzují, že opatření přijatá před evropským pracovním časem udržují služby ve stabilním stavu a bez potíží pro uživatele. Stále probíhá zařazování dříve upozaděného provozu plně do infrastruktury.
10.12.2019 7:32Telemetrická data ukazují dobré výsledky jak ve výkonu, tak ve stabilitě služeb. Probíhá zařazování dříve upozaděněho provozu plně do infrastruktury.
10.12.2019 2:18Monitoring stále ukazuje zdravý stav služeb a dříve upozaděný provoz je nyní průběžně pouštěn do infrastruktury. Mezi pracovními hodinami v severní Americe a Evropě se Microsoft zaměří na další optimalizaci výkonu služeb bez ovlivnění uživatelů.
9.12.2019 20:49Monitoring ukazuje zdravý stav služeb. V případě znovuobjevení potíží je Microsoft připraven okamžitě implementovat připravená opatření.
9.12.2019 19:25Analýza ukázala, že za potížemi zmíněnými v předchozím příspěvku byla část synchronizací dat. Telemetrická data ukazují, že výkon služeb je dle očekávání. Pokračuje monitoring.
9.12:2019 16:32V průběhu nárůstu provozu v severní Americe se ukazuje ještě lehký dopad potíží v infrastruktuře. Probíhá aplikace dalších nastavení (throttling), které by mělo zajistit stabilitu služeb. Paralelně probíhá analýza, co za tímto zjištěným dopadem stojí.
9.12.2019 13:20Monitoring ukazuje, že služby jsou stabilní i v běžných pracovních hodinách.
9.12.2019 8:47Monitoring služeb OneDrive for Business a SharePoint online během víkendu ukázal jejich zdravý stav. Monitoring bude pokračovat i v průběhu dnešních pracovních hodin.
7.12.2019 3:25Je potvrzeno, že potíže způsobila předchozí konfigurační změna týkající se ukládání do mezipaměti (caching) pro SharePoint online.
Nyní probíhá vrácení této změny, což ukazuje pozitivní výsledky.
Do konce pracovních hodin dalšího pondělí bude probíhat monitoring, zda služby nebudou vykazovat jiné nedostatky.
7.12.2019 0:52Během víkendu bude technický tým pokračovat na nalezení řešení pro další vylepení výkonu služeb.
Bylo dokončeno otestování sestavení, které bylo oznámeno ve čtvrtek, ovšem ukázalo se, že nepřineslo očekávané výsledky, takže se v tomto směru nepokračuje.
Pravděpodobně byla identifikována příčina potíží. Aktuálně se testuje změna v části dotčené infrastruktury a vypadá to nadějně. Pokud se toto potvrdí, bude spuštěno nasazení do celého prostředí.
6.12.2019 22:57Zdravý stav služeb po aplikaci strategií pokračuje. Dále se testují další krátkodobé strategie pro odstranění potíží. Aktuálním cílem je stabilizovat službu SharePoint online a pracovat na dlouhodobé strategii pro odstranění potíží.
6.12.2019 20:39Potvrzen pozitivní účinek strategií směřujících k odstranění potíží. Monitoring části prostředí, na které již byly aplikovány, vykazuje zdravý stav. Mimo toho se Microsoft snaží najít dlouhodobé řešení potíží se zaměření m na služby SharePoint a OneDrive for Business.
6.12.2019 18:32Pokračuje proces potvrzení možností řešení a jejich zátěžové testy.
6.12.2019 17:00Rozšíření rozsahu potíží: PowerApps, Power Automate (dříve Flow), Word, Excel a aplikace běžící na pozadí.
Bylo otestováni několik strategií pro odstranění potíží. Některé se ukázaly jako úspěšné, budou podrobeny ještě zátěžovému testu ped spuštěním jejich nasazení.
6.12.2019 13:03Některé testy činností popsaných v minulém příspěvku ukazují pozitivní výsledky. Probíhá podrobnější analýza pro potvrzení, zda lze činnosti rozšířit i do zbytku infrastruktury.
6.12.2019 10:01Probíhají následující činnosti:
- Vracení předchozích aktualizací v omezené části infrastruktury
- Izolace provozu v jiné části infrastruktury s cílem zjistit, kteří klienti služby SharePoint přispívají k potížím
6.12.2019 5:19Pokračuje příprava sestavení a jeho otestování v 18:00. Dále probéhá příprava dalších kroků, pokud by jen nasazení nového sestavení nepomohlo.
Dále se zjistilo, že problémy začaly již dříve, aktualizace času začátku problémů je 2.12.2019 17:00.
6.12.2019 2:26Uživatelé mohou mít potíže při migracích, synchronizaci obsahu OneDrive for Business a při uploadu velkých souborů.
Dříve popsané změny v dynamickém směrování provozu zajistily vylepšení situace. To se dále navýšilo při další optimalizaci provozu (málo prioritní provoz byl upozaděn).
Dále probíhá analýza kódu z poslední aktualizace s cílem odebrat některé ze změn. Vytváří se sestavení, které by to mělo provést a které by mělo být otestováno dnes v 18:00. Pokud bydou výsledky testování úspěšné, začne v 02:00 jeho nasazování.
5.12.2019 21:17Dosavadní analýza ukazuje, že za problémy může stát poslední aktualizace služby. Probíhá podrobná analýza aktualizace pro účely lepšího porozumění jejího vlivu na potíže.
5.12.2019 18:02Stále probíhají kroky popsané v předchozím bodu.
5.12.2019 16:03Stav služby je stabilní. Stále je aktivní dynamické směrování provozu. Probíhá analýza provozu v různých časech s cílem najít nesrovnalosti. Dále probíhá analýza procesů výrazně zatěžujících zdroje.
5.12.2019 13:01Zatímco aktuální náhradní řešení zůstává implementováno, probíhá analýza získaných dat a jejich porovnání s předchozím týdnem.
5.12.2019 10:58Probíhá získávání dalších dat.
5.12.2019 9:48Zůstává nasazeno dočasné řešení pro dynamické směrování provozu a čeká se na navyšující se provoz.
5.12.2019 8:00Pro případ opakování problémů je připraven sběr a vyhodnocení dalších dat.
5.12.2019 2:27Ačkoli se provedená úprava ukázala jako řešení, je velmi pravděpodobné, že během pracovních hodin dnešního dne se bude problém opakovat. Vypadá to, že navýšení provozu nebylo příčinou problémů.
4.12.2019 23:55Potvrzeno, že provedená úprava pro dynamické řízení přístupu je funkční. Dále probíhá zjišťování příčin potíží.
4.12.2019 21:44Stále probíhají činnosti popsané v kroku bezprostředně pod tímto
4.12.2019 19:19Stále probíhají níže popsané kroky - jsou aplikovány dočasné mechanismy pro dynamické řízení přístupu a zjišťování příčiny.
Rozšíření dopadu: Uživatelé mohou zaznamenat potíže při synchronizaci souborů se službou OneDrive for Business, a uživatelé služby SharePoint mohou zaznamenat chybu 503 Service unavailable nebo Server busy.
4.12.2019 18:44Vzhledem ke složitosti problému probíhá vyhodnocování telemetrických informací s cílem izolovat příčinu.
4.12.2019 14:53Pokračuje monitorování prostředí a jsou nastaveny dočasné mechanismy pro dynamické řízení přístupu.
4.12.2019 11:00Monitorovací systémy ukazují, že někteří uživatelé stále evidují výpadky nebo pomalé odezvy. Probíhá restartování odpovídajících součástí a aplikování dynamického řízení přístupu pro specifické požadavky. Dále probíhá vyhodnocení stavu diskového pole s obsahovými databázemi.
4.12.2019 1:56Výstupy z telemetrie vykazují zlepšení stavu, ačkoli někteří uživatelé mohou ještě pociťovat potíže. Pokračuje dohled databází.
3.12.2019 21:56Probíhá monitoring stavu obsahových databází, zd aa jak se projevila úprava provozu.
3.12.2019 20:03Pokračuje předchozí krok. Očekává se, že způsobí zmírnění dopadů. Dále probíhají práce na dlouhodobém řešení.
Příčina potíží: Příchozí provoz, který směruje uživatele do obsahových databází SQL je pomalý, nebo způsobuje výpadky
3.12.2019 18:06Probíhá aplikace dynamického řízení přístupu s cílem potlačení nekritických úloh. Dále probíhá implementace konfigurační změny s cílem zpracování vyššího objemu požadavků.
3.12.2019 17:35Probíhá analýza potíží a dopadu na organizace

Kategorie

Přihlášení

Zajímá Vás dění v Mainstreamu?

Informace o tom, co je nového, co chystáme a jak žijeme nejen v práci, ale i mimo ni, najdete na