Домен даних: Операції "MULTI COPY" при використанні ECS як хмарного рівня

Summary: У цій статті пояснюються деталі реалізації, коли ECS використовується з доменом даних для хмарного рівня. Він усуває потенційні непорозуміння під час перегляду журналів домену даних та ECS. ...

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

DELL ECS може використовуватися як хмарний провайдер з опцією DD Cloud Tier (Long-Term Retention, LTR). Докладнішу інформацію про DD LTR наведено у статті Dell KB 23144, Data Domain Restorer (DDR) and Long Term Retention (LTR) to the Cloud: Часті питання (FAQ/FAQs)

ECS та постачальники публічних хмар (такі як AWS, Azure та GCP) працюють точно так само, за винятком незначних деталей реалізації. Очищення Cloud Tier працює по-різному в ECS через те, що хмара ECS є локальною, належить замовнику, а отже:
  • Затримка та продуктивність швидші, ніж для постачальників загальнодоступних хмар
  • Користувачі не несуть додаткових витрат при споживанні пропускної здатності або виконанні операцій на ECS
  • ECS розроблена компанією DELL і має розширення стандарту протоколу S3. Це дозволяє йому виконувати очищення хмарного рівня ефективніше, ніж для постачальників загальнодоступних хмар

ECS має розширення S3, реалізоване під назвою "Діапазон копіювання". Це можна побачити в інших місцях, таких як MULTI COPY.
Це набір розширених заголовків, відсутній у стандарті S3, і, отже, підтримується лише ECS. Це дозволяє ECS створювати новий об'єкт, витягуючи діапазони байтів з існуючих об'єктів. Вся робота виконується через ECS, а не клієнта.

Ця нестандартна операція, підтримувана лише ECS, використовується DD лише під час фази чистої "копії" хмарного рівня. Це дозволяє DD запускати збір сміття (GC) на хмарних одиницях на основі ECS так само, як він працює на активному рівні (що є більш ефективним для відновлення невикористаного простору).
Він не використовується при записі нових даних в хмару під час руху даних (він використовує PUT), а також при згадуванні або читанні даних з хмарного блоку (коли він використовує GET).

Cause

Діапазон копіювання / MULTI COPY, будучи розширенням протоколу S3, це не новий метод.
Діапазон копіювання/MULTI COPY - це набір нових заголовків, який додається до викликів PUT. ECS знає, як інтерпретувати це, але не інші хмарні реалізації.

У DD є місця, де повідомляється MULTI COPY, замість PUT. Це потрібно для того, щоб відокремити звичайні PUT (які використовуються для запису даних у хмару під час руху даних) від тих, що генеруються під час КТ ГК (що було б так званим MULTI COPY, але вони СТАВЛЯТЬСЯ під капот).

Як приклад, ми можемо побачити, що для клієнта було повідомлено такі значення з інтервалом у 7 днів:
GENERATED_ON=Tue Jul 18 06:09:51 CEST 2023                       ||  GENERATED_ON=Tue Jul 25 06:09:52 CEST 2023
                                                                 ||  
Cloud op stats for bucket:xxxxxxxxxxxxxxxx-yyyyyyyyyyyyyyyy-d0   ||  Cloud op stats for bucket:xxxxxxxxxxxxxxxx-yyyyyyyyyyyyyyyy-d0
        Number of PUT object requests         : 1881             ||          Number of PUT object requests         : 559289     +    557,408 PUT
        Number of GET object requests         : 51               ||          Number of GET object requests         : 51         +          0 GET
        Number of DELETE object requests      : 1026             ||          Number of DELETE object requests      : 25149154   + 25,148,128 DELETE
        Number of MULTI COPY object requests  : 0                ||          Number of MULTI COPY object requests  : 18453552   + 18,453,552 MULTI COPY
        Number of LIST object requests        : 105847           ||          Number of LIST object requests        : 105847     +          0 LIST

DD буде повідомляти про обсяги виконаних операцій для PUT, GET, DELETE, MULTI COPY і LIST.
MULTI COPY не є дійсним методом S3, навіть для ECS. MULTI COPY дійсно СТАВИТЬСЯ з деякими спеціальними заголовками, доданими DD при запуску операції з ECS.

Під час перевірки на стороні ECS клієнти та служба підтримки ECS взагалі не бачать операцій "MULTI COPY". 

Вони бачать тільки, якщо це можливо, PUT, GET, DELETE і LIST. DD повідомляє PUT окремо при переміщенні даних у хмару. DD повідомляє MULTI COPY (які PUT генеруються під час CT GC, для створення нових об'єктів з діапазонів байтів, прочитаних з існуючих об'єктів у хмарі).

З цієї причини клієнти та служба підтримки ECS бачать, що PUT запускається з DD під час DD CT GC. Це може бути неправильно зрозуміло як нові дані (переміщення даних з DD), але це може бути пов'язано з постійним DD CT GC (який робить MULTI COPY, тобто PUT зі спеціальними параметрами).

Кожна операція MULTI COPY, записана в статистиці DD, призводить до однієї операції PUT, записаної на стороні ECS.

ПІД ЧАС ДД КТ ГК процес вступає у фазу «фонових видалень». 
Це коли DD CT GC завершив усі пересилання копій за допомогою MULTI COPY. Тепер він просить ECS видалити всі вихідні об'єкти, з яких ми читаємо діапазони байтів.
У наведеній вище статистиці кількість DELETE протягом тижня перевищує загальну кількість нових об'єктів (PUT, для нових даних, і MULTI COPY, для пересилання копій під час CT GC).
Це призводить до чистого приросту простору на хмарному рівні

У цьому прикладі 557 408 + 18 453 552 - 25 148 128 = -6 137 168, тобто більше 20 TiB пост комп зі звичайним розміром об'єкта для хмарних одиниць на базі ECS.

Resolution

Це очікувана поведінка.

Деякі операції PUT, що виконуються DD до ECS, є особливим типом, званим "MULTI COPY" на стороні DD, але вони відображаються як звичайні PUT на стороні ECS.

MULTI COPY генерується тільки з DD під час КТ GC. Вони створюють єдиний новий об'єкт у хмарі, зчитуючи діапазони байтів від існуючих об'єктів в ECS. Все це відбувається всередині самої ECS.
Це має такі наслідки:
  • Під час DD CT GC, ECS в якийсь момент бачить багато операцій PUT (які є DD MULTI Copy). Це цілком очікувано і викликає тимчасове збільшення використання пам'яті на ECS
  • Після того, як DD CT GC завершив копіювання вперед, він видає DELETE до ECS і починає звільняти місце. ECS звільнення місця на власному сховищі може бути відкладено через те, як працює ECS GC
  • Може бути важко сказати PUT для нових даних, крім PUT для DD CT GC. Зверніться до служби підтримки ECS, чи потрібна допомога в цьому.
  • MULTI COPY є розширенням стандарту S3 і трапляється тільки з хмарними пристроями на базі ECS
  • MULTI COPY просить ECS прочитати з існуючих об'єктів для створення нового об'єкта, це може призвести до збоїв або попереджень про пошкодження на DD. Очікується, що всі вихідні об'єкти існують в ECS. Якщо ні, ДД КТ ГК зупиняється і повідомляє про попередження про несправність ДД КТ ГК, помилку перевірки цілісності або пошкодження. У такому разі зверніться до служби підтримки доменів DELL Data Domain.
  • Навіть якщо розширення MULTI COPY реалізовані в ECS, вони не підтримуються користувачами IAM. Тільки (звичайні) користувачі об'єктів, створені з ECS, можуть використовувати розширення MULTI COPY. Якщо хмарний профіль DD налаштований з обліковими даними користувача IAM, або звичайний користувач об'єкта пізніше змінений на користувача IAM, все буде нормально працювати на DD з ECS, крім чистого. Це в кінцевому підсумку не вдасться з таким попередженням:
Jul 19 11:24:59 dd.example.com ddfs[10217]: INFO: Event posted: m0-4577 (210011e1:553652705): EVT-CLOUD-00001: Unable to access provider for cloud unit ECS_CLOUD_UNIT.EVT-OBJ::CloudUnit=ECS_CLOUD_UNIT EVT-INFO::Cause=IAM user is not supported for Copy Range API

Affected Products

Data Domain
Article Properties
Article Number: 000216319
Article Type: Solution
Last Modified: 11 Aug 2023
Version:  2
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.