Як працює Ethereum? (Ukraine ver.)

READ STORY
Special thanks to Uliana Didych, Volodymyr Cherepanyak for translating this post into Ukraine.

Знайомство

Ви мабуть чули про Ethereum, та можливо не знаєте що це таке. Останнім часом він часто з’являється в новинах, включно з обкладинками серйозних журналів, однак, якщо не мати уявлення, чим саме є Ethereum, то ці статті виглядають як набір незрозумілих символів. То ж чим він є? По суті, це публічна база даних, яка постійно реєструє цифрові транзакції. Важливим є той фактор, що для її ведення і безпеки не потрібне централізоване управління. Натомість вона працює як система транзакцій, яка не потребує довіри, — оболонка, в якій окремі користувачі можуть здійснювати прямі транзакції, не вимагаючи довіри до третіх сторін АБО один до одного.

Все ще не зовсім зрозуміло? Саме про це цей допис. Моєю метою є пояснити, як працює Ethereum на технічному рівні, не використовуючи складну математику або відлякуючі формули. Навіть, якщо ви не програміст, сподіваюся, в результаті ви краще розумітимете механізм. Якщо деякі моменти будуть надто технічні, щоб їх грокнути, це нормально. Нема потреби розуміти всі деталі.

Рекомендую зосередитися на загальному рівні розуміння. Багато охоплених тут тем є розшифруванням понять, викладених у жовтих сторінках. Для простішого розуміння Ethereum я додав власні пояснення й діаграми. Якщо ж ви достатньо сміливі, щоб прийняти технічний виклик, почитайте також жовті сторінки Ethereum.

То ж до праці!

Визначення блокчейну

Блокчейн — це «криптографічно захищена одинична машина транзакцій з доступним станом». [1] ****Дещо заплутано, правда? Давайте, розкладемо на частини.

  • «Криптографічно захищена» означає, що створення цифрової валюти захищено складними математичними алгоритмами, які надзвичайно важко зламати. Це як брандмауер або щось подібне. Цю систему практично неможливо обдурити (наприклад, створити фейкову транзакцію, видалити транзакцію тощо).
  • «Одинична машина транзакцій» означає, що існує єдиний канонічний примірник машини, відповідальної за всі транзакції, створені в системі. Іншими словами, існує єдина глобальна істина, якій всі довіряють.
  • «З доступним станом» означає, що стан, збережений у цьому алгоритмі, доступний всім.

Система Ethereum втілює цю модель.

Роз’яснення моделі блокчейну Ethereum

За своєю суттю блокчейн Ethereum є транзакційною машиною станів. В комп’ютерних науках машина станів це щось, що зчитує набір вхідих даних, і на їх основі переходить в інший стан.

Говорячи про машину станів Ethereum, розпочнемо зі «стану генези». Це як чистий аркуш до того, як у мережі відбулися будь-які транзакції. Після виконання транзакції цей стан генези переходить у деякий фінальний стан. У будь-який момент часу цей фінальний стан репрезентує поточний стан Ethereum.

Стан Ethereum містить мільйони транзакцій. Ці транзакції групуються у «блоки». Блок містить набір транзакцій, і кожний наступний блок пов’язаний у ланцюжок з попереднім.

Щоб система перейшла з одного стану в інший, транзакція має бути дійсною. Щоб транзакцію було визнано дійсною, вона має пройти через процедуру валідації, яку називають майнінгом. Майнінг — це процес, коли група вузлів (наприклад, комп’ютерів) витрачає свої обчислювальні ресурси для створення блоку дійсних транзакцій.

Будь-який вузол у мережі, який заявляє себе майнером, може спробувати створити і схвалити блок. Одночасно велика кількість майнерів в усьому світі намагається створювати і схвалювати блоки. Кожен майнер, відправляючи блок у блокчейн, подає математичне «підтвердження». Це підтвердження діє як гарантія: якщо воно існує, блок має бути дійсний.

Щоб блок було додано до головного ланцюжка, майнер має підтвердити його швидше за конкурентів. Процес, під час якого майнер схвалює кожний блок, надаючи математичне підтвердження, називається «доказ роботи» (proof of work).

Майнер, який схвалив блок, отримує винагороду в розмірі певної вартості виконання цієї роботи. Якою є ця вартість? Блокчейн Ethereum використовує власний цифровий токен, який називається «Ether». Щоразу, коли майнер схвалює новий блок, генеруються і присвоюються нові токени Ether.

Може виникнути питання: а де гарантія, що всі дотримуються одного ланцюжка блоків? Звідки впевненість, що не існує якась підмножина майнерів, які вирішили створити власний ланцюжок блоків?

Раніше ми визначили блокчейн, як криптографічно захищену одиничну машину транзакцій з доступним станом. Згідно цього визначення правильний поточний стан це єдина глобальна істина, яку всі мають прийняти. Наявність багатьох станів (або ланцюжків) зруйнує всю систему, оскільки буде неможливо визначити, який стан є правильним. Якщо ланцюжки розгалужуються, у вас може бути 10 монет на одному ланцюжку, 20 на другому і 40 на третьому. В такому сценарії немає можливості визначити, який ланцюжок найбільш «правильний». Якщо генерується декілька шляхів, виникає «розгалуження».

Ми зазвичай намагаємося уникати розгалужень, оскільки вони переривають систему і змушують людей вибирати, в який ланцюжок «вірити».

Щоб визначити правильний шлях і уникнути створення кількох ланцюжків, Ethereum використовує механізм, який називається «протокол GHOST».

«GHOST» = «Greedy Heaviest Observed Subtree» (візуально найважче піддерево).

Простими словами, протокол GHOST вказує вибирати той шлях, за яким здійснено набільше обчислень. Єдиним способом визначити такий шлях є використання номера останнього блоку («кінцевий блок»), який представляє загальну кількість блоків поточного шляху (без урахування генези). Що більший номер блоку, то довший шлях і більше зусиль майнінгу докладено, щоб досягнути цього кінцевого блоку. Використання цього механізму дозволяє дійти згоди щодо канонічної версії поточного стану.

Після загального знайомства з блокчейном, давайте розглянемо детальніше основні компоненти, з яких складається система Ethereum:

  • облікові записи;
  • стан;
  • gas і оплати;
  • транзакції;
  • блоки;
  • виконання транзакції;
  • майнінг;
  • доказ роботи.

Для початку одне зауваження: вживаючи термін «геш» X, я маю наувазі геш KECCAK-256 , який використовує Ethereum.

Облікові записи

Глобальний «доступний стан» Ethereum складається з багатьох дрібних об’єктів («облікових записів»), які можуть взаємодіяти між собою в оболонці для передачі повідомлень. Кожний обліковий запис має свій стан, пов’язаний з 20-байтною адресою. Адресою в Ethereum є 160-бітний ідентифікатор, який використовується для ідентифікації кожного облікового запису.

Є два типи облікових записів:

  • Зовнішні облікові записи, які контролюються приватними ключами і не мають пов’язаного з ними коду.
  • Контрактні облікові записи, які контролюються власним контрактним кодом і мають пов’язаний з ними код.

Зовнішні облікові записи vs. контрактні облікові записи

Важливо розуміти фундаментальну різницю між зовнішніми і контрактними обліковими записами. Зовнішній обліковий запис може надсилати повідомлення іншим зовнішнім обліковим записам АБО іншим контрактним обліковим записам, створивши і підписавши транзакцію за допомогою свого приватного ключа. Повідомлення між зовнішніми обліковими записами — це просто передавання вартості. Однак повідомлення з зовнішнього облікового запису на контрактний активізує код контрактного рахунку, даючи змогу виконувати різні операції (наприклад, передача токенів, запис у внутрішнє сховище, виконання обчислень, створення нових контрактів тощо).

На відміну від зовнішніх облікових записів, контрактні не можуть ініціювати нові тразакції самостійно. Натомість, контрактні облікові записи можуть лише запускати транзакції у відповідь на інші, отримані ними транзакції (від зовнішнього облікового запису або іншого контрактного облікового запису). Детальніше про виклики контракт-контракт буде розглянуто в розділі «Транзакції і повідомлення».

Тому будь-яка операція, яка виникає у блокчейні Ethereum завжди запущена транзакцією з зовнішнього облікового запису.

Стан облікового запису

Стан облікового запису складається з чотирьох компонентів, наявних, не залежно від типу облікового запису:

  • nonce: якщо обліковий запис є зовнішнім, це число представляє кількість транзакцій, надісланих з адреси облікового запису. Для контрактного облікового запису це кількість контрактів, ним створених.
  • balance: кількість Wei у власності цієї адреси. На 1 Ether припадає 1e+18 Wei.
  • storageRoot: геш кореневого вузла дерева Меркла «Патріція» Patricia (роз’яснення дерев Меркла буде згодом). Це дерево кодує геш вмісту сховища цього облікового запису і за замовчуванням є порожнім.
  • codeHash: геш коду EVM (віртуальна машина Ethereum — про це згодом) цього облікового запису. Для контрактних облікових записів це код, який гешується і зберігається як codeHash. Для зовнішніх облікових записів поле codeHash є гешем порожнього рядка.

Світовий стан

Отже, тепер ми знаємо, що глобальний стан Ethereum складається з відображення між адресами облікових записів і станами облікових записів. Це відображення зберігається у структурі даних, відомій як дерево Меркла «Патріція».

Дерево Меркла (відоме також як префіксне дерево Меркла) є типом бінарного дерева, сформованого з набору вузлів із:

  • великою кількістю вершин в основі дерева, які містять вкладені дані;
  • набором проміжних вузлів, в якому кожен вузол є гешем двох його дочірніх вузлів;
  • з єдиним кореневим вузлом, також сформованим з гешу його дочірніх вузлів, який представляє вершину дерева.

Дані в основі дерева формуються розділенням даних, які потрібно зберегти, на порції, відтак порції діляться на сегменти, а тоді створюється геш кожного сегменту. Цей процес повторюється, поки загальна кількість гешів, що залишилися, стане одиницею: кореневий геш.

Для цього дерева потрібно мати ключ для кожного значення, збереженого в ньому. Починаючи з кореневого вузла, ключ визначає, який з дочірніх елементів вибирати, щоб отримати потрібне значення, збережене у вузлах вершин. У випадку з Ethereum відображенням ключ / значення для дерева стану є відображення між адресами і пов’язаними з ними обліковими записами, включно з полями balance, nonce, codeHash і storageRoot для кожного облікового запису (де storageRoot також є деревом).

Джерело: біла книга Ethereum. Така ж структура дерева використовується для зберігання транзакцій і квитанцій. Якщо детальніше: то кожен блок має «заголовок», в якому зберігається геш кореневого вузла трьох різних структур дерев Меркле, а саме:

  1. дерево стану;
  2. дерево транзакцій;
  3. дерево квитанцій.

Можливість ефективно зберігати всю інформацію в деревах Меркле виявилася надзвичайно корисною в Ethereum для того, що ми називаємо «легкі клієнти» або «легкі вузли». В загальних рисах є два типи вузлів: повні і легкі.

Повний архівний вузол синхронізує блокчейн, завантажуючи увесь ланцюжок від блоку генези до поточного кінцевого блоку, виконуючи всі транзакції, які він містить. Як правило, майнери зберігають повний архівний вузол, бо цього вимагає процес майнінгу. Також можна завантажити повний вузол, не виконуючи кожну транзакцію. Тим не менше, будь-який повний вузол містить увесь ланцюжок.

Проте, якщо для вузла не потрібне виконання всіх транзакцій або легкого доступу до історії, немає потреби зберігати увесь ланцюжок. І тут стає в пригоді концепція легкого вузла. Замість завантажувати і зберігати увесь ланцюжок і виконувати всі транзакції, легкі вузли завантажують лише ланцюжок заголовків від блоку генези і до поточної вершини, не виконуючи жодних транзакцій і не видобуваючи пов’язані стани. Оскільки легкі вузли мають доступ до заголовків блоків, які містять геші трьох дерев, вони можуть легко генерувати й отримувати достовірні відповіді про транзакції, події, баланси тощо.

Це працює, бо геші в дереві Меркле передаються вгору — якщо зловмисник спробує вставити фейкову транзакцію внизу дерева Меркле, ця зміна викличе зміну в геші вузла вище, що в свою чергу змінить геш наступного вузла, і таким чином дійде до кореня дерева.

Будь-який вузол може перевірити частину даних, використавши процедуру з назвою «підтвердження Меркле». Підтвердження Меркле складається з:

  1. порції даних, яку треба перевірити, і їх гешу;
  2. гешу кореня дерева;
  3. гілки (всіх партнерських гешів, вгору від потрібної порції до кореня).

Будь-хто, зчитавши підтвердження, може перевірити, чи гешування гілки цілісне до кореня дерева, і таким чином, чи дана порція дійсно знаходиться у вказаній позиції в дереві.

У підсумку перевагою використання дерева Меркле «Патріція» є те, що кореневий вузол структури криптографічно залежить від збережених у дереві даних, а отже може використовуватися як захищений примірник цих даних. Оскільки заголовок блоку містить кореневий геш дерев стану, транзакцій і квитанцій, будь-який вузол може перевірити невелику частину стану Ethereum без потреби зберігати увесь стан, який може мати необмежений розмір.

Gas і оплати

Одним із дуже важливих концептів Ethereum є концепт оплат. Кожне обчислення, яке виникає в результаті транзакції в мережі Ethereum, вимагає оплати — безкоштовного нічого не буває. Ця оплата здійснюється в одиницях, які називаються «gas».

Gas — це одиниця вимірювання оплат, які нараховуються за певне обчислення. Ціна gas — це кількість Ether, яку ви хочете витратити за кожну одиницю gas, вимірюється у «gwei». «Wei» — найменша частина Ether, 1⁰¹⁸ Wei = 1 Ether. 1 gwei = 1 000 000 000 Wei.

Для кожної транзакції відправник встановлює ліміт gas і ціну gas. Добуток ціни gas і ліміту gas визначає максимальну кількість Wei, яку відправник має намір заплатити за виконання транзакції.

Наприклад, скажімо, відправник встановив ліміт gas 50 000, а ціну gas 20 gwei. Це означає, що відправник хоче витратити 50 000 x 20 gwei = 1 000 000 000 000 000 Wei = 0,001 Ether за виконання транзакції.

Пам’ятаємо, що ліміт gas — це максимальна кількість gas, на яку відправник має намір витратити кошти. Якщо на балансі його облікового запису є достатньо Ether, щоб покрити цей максимум, можна виконувати транзакцію. Після завершення транзакції всі кошти за невикористані gas повертаються відправникові за початковою вартістю.

У разі, якщо відправник не надав достатню кількість gas для виконання транзакції, транзакція вважається недійсною з позначкою «недостатньо gas». У цьому випадку виконання транзакції переривається, всі зміни стану, які виникли в процесі, скасовуються, і Ethereum повертається до стану перед транзакцією. Крім того здійснюється запис про невдалу спробу транзакції із зазначенням етапу, на якому вона виявилася невдалою. А оскільки машина вже витратила зусилля для обчислень до того, як закінчилися gas, логічно, що кошти за gas відправникові не повертаються.

То ж на що саме йдуть ці кошти gas? Усі кошти, витрачені відправником на gas, надсилаються на адресу «бенефіціара», яка зазвичай є адресою майнера. Оскільки майнери витрачають зусилля для обчислень і перевірки транзакцій, вони отримують оплату за gas як винагороду.

Як правило, що вищу ціну за gas відправник готовий заплатити, то вищу вартість отримає майнер з транзакції. Таким чином, майнери охочіше вибиратимуть такі транзакції. То ж майнери можуть вільно вибирати, які транзакції схвалювати або ігнорувати. Щоб зорієнтувати відправників, яку ціну за gas встановлювати, майнери можуть оголошувати мінімальну ціну за gas, за яку вони виконають транзакції.

Також нараховується плата за зберігання

Gas використовуються для оплати не тільки за обчислення, але й за використання сховища. Загальна плата за сховище пропорційна найменшому кратному використаних 32 байтів.

Щодо оплати за сховище є деякі нюанси. Наприклад, якщо ви збільшуєте сховище, збільшується розмір бази даних стану Ethereum на всіх вузлах, це спонукає зберігати невеликий обсяг даних. Тому, якщо транзакція містить етап, який вилучає запис зі сховища, оплата за цю операцію не стягується І повертаються кошти за звільнення місця в сховищі.

Яка мета оплат?

Одним із важливих аспектів роботи Ethereum є те, що виконання кожної окремої операції в мережі одночасно здійснюється всіма повними вузлами. Проте, обчислювальні кроки на віртуальній машині Ethereum дуже дорогі. Тому смарт-контракти Ethereum краще використовувати для простих задач, як от бізнес-логіка, перевірка підписів та інших криптографічних об’єктів, аніж для складних — зберігання файлів, електронна пошта або машинне навчання, — які можуть збільшити навантаження на мережу. Застосування оплати запобігає перенавантаженню мережі.

Ethereum є мовою, повною за Тюрінгом. (Якщо коротко, то машина Тюрінга — це машина, яка може симулювати будь-який комп’ютерний алгоритм (якщо ви не знайомі з поняттям машини Тюрінга, перегляньте це і це посилання)). Це дозволяє використовувати цикли, а також робить систему Ethereum вразливою до проблеми зупинки, яка полягає в тому, що неможливо визначити, чи робота програми колись завершиться. Без оплат зловмисник може легко і без наслідків для себе зруйнувати мережу, виконавши нескінчений цикл транзакцій. Таким чином оплата захищає мережу від навмисних атак.

Може виникнути питання: «а чому потрібно платити ще й за зберігання?" Як і з обчисленнями, за зберігання даних в Ethereum відповідає вся мережа.

Транзакції і повідомлення

Раніше ми вже згадували, що Ethereum це машина стану на основі транзакцій. Іншими словами, саме транзакції між різними обліковими записами спричиняють зміну глобального стану Ethereum.

Найпростішими словами, транзакція — це криптографічно підписана інструкція, згенерована зовнішнім обліковим записом, серіалізована і надіслана у блокчейн.

Є два типи транзакцій: повідомлення і створення контракту (наприклад, транзакції, які створюють нові контракти Ethereum).

Не залежно від типу, транзакції складаються з таких компонентів:

  • nonce: лічильник кількості транзакцій, надісланих відправником.
  • gasPrice: кількість Wei, яку відправник готовий заплатити за одиницю gas, потрібних для виконання транзакції.
  • gasLimit: максимальна кількість gas, яку відправник має намір заплатити за виконання транзакції. Ця кількість задається і сплачується заздалегідь перед виконанням обчислень.
  • to: адреса отримувача. В транзакції створення контракту адреса контрактного облікового запису ще не існує, тому використовується порожнє значення.
  • value: кількість Wei, які передаються від відправника до отримувача. У транзакціях для створення контракту це значення служить початковим балансом для нового контрактного облікового запису.
  • v, r, s: використовується для генерування підпису, який ідентифікує відправника транзакції.
  • init (тільки для транзакцій створення контракту): фрагмент коду віртуальної машини Ethereum, який використовується для ініціалізації нового контрактного облікового запису.
  • init запускається лише раз і потім вилучається. Під час першого запуску init він повертає тіло коду облікового запису, який є частиною коду, що постійно пов’язана з контрактним обліковим записом.
  • data (необов’язкове поле, існує лише в повідомленнях): вхідні дані (наприклад, параметри) повідомлення. Наприклад, якщо смарт-контракт є службою реєстрації доменів, в повідомленні до цього контракту можуть очікуватися такі поля, як домен і IP-адреса.

У розділі «Облікові записи» ми з’ясували, що транзакції, — як повідомлення, так і створення контрактів, — завжди ініціюються зовнішніми обліковими записами і надсилаються у блокчейн. З іншого боку транзакції можна розглядати як місток від зовнішнього світу до внутрішнього стану Ethereum.

Однак, це не означає, що контрактні облікові записи не можуть комунікувати між собою. Контракти, які існують в межах глобального стану Ethereum, можуть комунікувати з такими ж контрактами в тих же межах. Ця комунікація відбувається через «повідомлення» або «внутрішні транзакції» з іншими контрактними обліковими записами. Повідомлення або внутрішні транзакції схожі на звичайні транзакції з однією суттєвою відмінністю: їх НЕ згенеровано зовнішніми обліковими записами. Натомість, їх генерують контрактні облікові записи. Це віртуальні об’єкти, які, на відміну від транзакцій, не серіалізуються й існують тільки в середовищі виконання Ethereum.

Коли один контрактний обліковий запис надсилає внутрішню транзакцію на інший, виконується пов’язаний код, який існує в контрактному обліковому записі отримувача.

Тут важливо зазначити, що внутрішні транзакції або повідомлення не містять параметра gasLimit. Це тому, що ліміт gas встановлюється зовнішнім відправником оригінальної транзакції (наприклад, певним зовнішнім обліковим записом). Ліміт gas, встановлений зовнішнім обліковим записом, має бути достатньо високим для здійснення транзакції, включно з усіма підзадачами, які виникають в результаті транзакції, в тому числі повідомленнями між контрактними обліковими записами. Якщо в ланцюжку транзакцій і повідомлень під час виконання певного повідомлення закінчаться gas, виконання повідомлення скасується разом з усіма наступними повідомленнями, запущеними цим виконанням. Проте, батьківське виконання не скасовується.

Блоки

Усі транзакції групуються в «блоки». Блокчейн складається з набору таких блоків, пов’язаних у ланцюжок.

Блок в Ethereum складається з:

  • заголовка блоку;
  • інформації про набір транзакцій, включених в блок;
  • набору заголовків інших блоків-дядьків поточного блоку.

Пояснення блоків-дядьків

Що таке «дядько»? «Дядько» — це блок, батьківський блок якого є одночасно батьківським блоком для батьківського блоку поточного блоку. Давайте швидко ознайомимося з тим, для чого використовується поняття «дядько», і навіщо блок містить заголовки блоків-дядьків.

Завдяки способу побудови Ethereum, час, потрібний на формування блоку, набагато менший (близько 15 с.), ніж в інших блокчейнах, наприклад у Bitcoin (близько 10 хв.). Це дає змогу швидше опрацьовувати транзакції. Проте, зворотньою стороною швидшого формування блоків є те, що майнери знаходять більше рішень для формування альтернативних блоків. Ці альтернативні блоки також називають «блоками-сиротами» (тобто створені блоки не включені в головний ланцюг).

Завданням блоків-дядьків є допомгти майнерам отримати винагороду за включення цих блоків-сиріт. Блоки-дядьки, яких майнери включають в ланцюг, мають бути дійсними, тобто належати до шостого або молодшого покоління поточного блоку. Після шостого покоління на застарілі блоки-сироти посилатися неможливо (оскільки включення старіших транзакцій дещо ускладнює завдання).

Винагорода за блок-дядька менша, ніж за повний блок. Проте, для майнерів залишається стимул включати ці блоки-сироти й отримувати винагороду.

Заголовок блоку

Давайте ненадовго повернемося до блоків. Ми згадували раніше, що кожний блок має «заголовок». Що це таке?

Заголовком блоку є частина блоку, яка складається з таких даних:

  • parentHash: геш заголовків батьківських блоків (саме він перетворює набір блоків на ланцюг);
  • ommersHash: геш списку блоків-дядьків поточного блоку;
  • beneficiary: адреса облікового запису, який отримає винагороду за майнінг цього блоку;
  • stateRoot: геш кореневого вузла дерева стану (тут доцільно нагадати, що дерево стану зберігається у заголовку і спрощує перевірки стану для легких клієнтів);
  • transactionsRoot: геш кореневого вузла дерева, яке містить транзакції, перелічені у цьому блоці;
  • receiptsRoot: геш кореневого вузла дерева, яке містить квитанції усіх транзакцій, перелічених у цьому блоці;
  • logsBloom: фільтр Блума (структура даних), який складається з інформації журналу;
  • difficulty: рівень складності блоку;
  • number: номер поточного блоку (блок генези має номер 0, а номер кожного наступного блоку збільшується на 1);
  • gasLimit: поточний ліміт gas на блок;
  • gasUsed: загальна сума gas, використана для транзакцій у цьому блоці;
  • timestamp: часова позначка Unix створення цього блоку;
  • extraData: додаткові дані, пов’язані з цим блоком;
  • mixHash: геш, який у разі поєднання з nonce, підтверджує, що в блоці здійснено достатню кількість обчислень;
  • nonce: геш, який у разі поєднання з mixHash, підтверджує, що в блоці здійснено достатню кількість обчислень.

Зауважте, кожен заголовок блоку містить три структури для:

  • стану (stateRoot);
  • транзакцій (transactionsRoot);
  • квитанцій (receiptsRoot).

Ці структури є нічим іншим, як деревами Меркле «Патріція», про які йшла мова раніше.

Крім того, раніше згадувалися декілька термінів, які слід пояснити детальніше.

Ось вони.

Журнали

Журнали в Ethereum дозволяють відстежувати різноманітні транзакції й повідомлення. Контрактний обліковий запис може явно генерувати журнал, визначивши «події», які слід туди внести.

Запис журналу містить:

  • адресу облікового запису, який вносить запис в журнал;
  • набір тем, які представляють різноманітні події, спричинені транзакцією;
  • будь-які дані, пов’язані з цими подіями.

Журнали зберігаються у фільтрі Блума, який ефективно зберігає нескінчені дані журналу.

Квитанції транзакцій

Записи журналу в заголовку формуються з інформації журнальних записів, яка міститься в квитанції транзакції. Так, як ви отримуєте квитанцію, придбавши щось у крамниці, так і Ethereum генерує квитанцію для кожної транзакції. Зрозуміло, що кожна квитанція містить певну інформацію про транзакцію.

Квитанція містить такі елементи, як:

  • номер блоку;
  • геш блоку;
  • геш транзакції;
  • gas, використані для поточної транзакції;
  • сумарна кількість gas: використаних для поточного блоку після виконання поточної транзакції;
  • журнальні записи, створені після виконання поточної транзакції;
  • ... і т.д.

Складність блоку

«Складність» блоку використовується для забезпечення часової сумісності схвалення блоків. Складність блоку генези становить 131 072, а для обчислення складності всіх наступних блоків використовується спеціальна формула. Якщо певний блок схвалюється швидше, ніж попередній, протокол Ethereum підвищує його складність.

Складність блоку впливає на параметр nonce, який є гешем, що обчислюється в процесі майнінгу блоку за допомогою алгоритму «доказ роботи».

Математично залежність між складністю блоку і параметром nonce виглядає так:

де Hd — складність.

Єдиний спосіб підібрати параметр nonce, який задовольняє умові порогу складності, є перелічення всіх можливостей за допомогою алгоритму «доказ роботи». Очікуваний час пошуку розв’язку пропорційний складності — що вища складність, то важче знайти значення nonce і важче схвалити блок, через що збільшується час схвалення нового блоку. Таким чином, змінивши складність блоку, протокол може змінити час, необхідний для його схвалення. І навпаки, якщо схвалення триває довше, протокол зменшує складність блоку.

У такий спосіб час схвалення самоналаштовується для збереження однакового значення, — в середньому один блок схвалюється що 15 секунд.

Виконання транзакції

Переходимо до однієї з найскладніших частин протоколу Ethereum: виконання транзакцій. Припустимо, ви надсилаєте транзакцію в мережу Ethereum для обробки. Що відбувається для того, щоб Ethereum змінив стан і включив вашу транзакцію?

В першу чергу для того, щоб транзакція виконалася, вона має задовільняти початковому набору вимог. До них належать:

  • Транзакція має бути правильно відформатована за допомогою кодування RLP. «RLP» (Recursive Length Prefix) є форматом даних, який використовується для кодування вкладених масивів бінарних даних. Ethereum використовує формат RLP для серіалізації об’єктів.
  • Дійсний підпис транзакції.
  • Дійсний номер nonce. Нагадуємо, що параметр nonce облікового запису є лічильником транзакцій, надісланих з цього облікового запису. Щоб транзакція була дійсною, її значення nonce має бути еквівалентним значенню nonce облікового запису.
  • Ліміт gas транзакції мати бути рівним або більшим, ніж власне значення gas, яке використовується транзакцією. Власне значення gas включає:
  1. наперед визначену вартість виконання транзакції 21 000 gas;
  2. оплата gas за надсилання даних з транзакцією (4 gas за кожний нульовий байт даних або коду і 68 gas за кожний ненульовий байт даних або коду);
  3. додаткова оплата 32 000 gas, якщо транзакція створює контракт.
  • На балансі облікового запису відправника має бути достатньо Ether для авансової оплати gas, які має сплатити відправник. Обчислення вартості авансового платежу gas просте: спершу слід помножити ліміт gas транзакції на ціну gas транзакції, щоб визначити максимальну вартість gas. Тоді ця максимальна вартість додається до загальної суми, яка передається в транзакції від відправника до одержувача.

Якщо транзакція відповідає всім переліченим критеріям дійсності, відбувається перехід до наступного кроку.

Спершу з балансу відправника знімається авансова оплата за виконання, а параметр nonce облікового запису відправника збільшується на 1, щоби врахувати поточну транзакцію. Тепер обчислюється залишок gas, як загальний ліміт gas для транзакції мінус використане власне значення gas транзакції.

Після цього починається виконання транзакції. Під час виконання транзакції Ethereum відстежує «підстан». Це спосіб запису інформації, отриманої під час транзакції, яка буде потрібна відразу після завершення виконання.

Зокрема, сюди належать:

  • Набір самоліквідації: набір облікових записів (якщо такі є), які потрібно ліквідувати після виконання транзакції.
  • Журнальні записи: архівовані й індексовані контрольні точки виконання коду віртуальної машини.
  • Баланс відшкодування: сума, яку має бути повернено відправнику після транзакції. Пригадуєте, раніше було сказано, що за сховище Ethereum потрібно платити, а відправникові відшкодовуються кошти за звільнення сховища? Ethereum відстежує це за допомогою лічильника відшкодувань. Лічильник відшкодувань рівний нулю і збільшується щоразу, коли контрактний обліковий допис видаляє щось зі сховища.

Після цього виконуються обчислення, передбачені транзакцією.

Після того, як всі кроки, необхідні для транзакції, виконані, якщо немає недійсних станів, стан фіналізується і визначається, скільки gas не використано і буде повернено відправникові. Окрім невикористаних gas, відправник також отримає певні кошти з «балансу відшкодування», описаного вище.

Після відшкодування відправникові:

  • майнер отримує Ether за gas;
  • gas, використані для транзакції, додаються до лічильника gas блоку (цей лічильник відстежує загальну кількість gas, використаних для транзакції, і використовується під час валідації блоку);
  • видаляються усі облікові записи з набору самоліквідації (якщо такі є).

В результаті ми отримуємо новий стан і набір журналів, створених транзакцією.

Після того, як ми ознайомилися з основами виконання транзакцій, давайте розглянемо відмінності між транзакціями створення контракту і повідомленнями.

Створення контракту

Нагадаємо: що в Ethereum є два типи облікових записів: контрактні і зовнішні. Коли мова йде про транзакцію «створення контракту», мається наувазі, що метою транзакції є створення контрактного облікового запису.

Щоб створити новий контрактний обліковий запис, спершу слід задекларувати його адресу, використовуючи спеціальну формулу. Після цього ініціалізується новий обліковий запис за такою процедурою:

  • для nonce встановлюється значення «0»;
  • якщо відправник відсилає за допомогою транзакції певну кількість Ether як вартість, це значення присвоюється балансу облікового запису;
  • вартість, додана на баланс нового облікового запису, віднімається від балансу відправника;
  • визначається порожнє сховище;
  • codeHash контракту визначається, як геш порожнього рядка.

Після ініціалізації облікового запису його можна створити, надіславши з транзакцією код init (щоб нагадати собі, що це таке, перегляньте розділ «Транзакції і повідомлення»). Виконання цього коду відбувається по різному. Залежно від конструктора контрактів, може оновлюватися сховище облікового запису, створюватися інші контрактні облікові записи, надсилатися нові повідомлення тощо.

Під час виконання коду для ініціалізації контракту використовуються gas. Транзакція не може використати більше gas, ніж його залишилося. Якщо це трапилося, виконання переривається з винятком out-of-gas (OOG). Якщо виконання транзакції припинилося з винятком out-of-gas, стан повертається до значення безпосередньо перед транзакцією. Відправник не отримує відшкодування gas, витрачених до переривання.

Шкода.

Проте, якщо відправник надіслав з транзакцією Ether, цю суму буде повернено, навіть якщо не вдасться створити контракт.

І це добре.

Якщо код ініціалізації виконано успішно, буде стягнуто кінцеву вартість створення контракту. Це вартість сховища, вона пропорційна розміру коду створення контракту (нічого не буває безкоштовним!). Якщо для сплати цієї вартості залишилося недостатньо gas, транзакцію буде перервано з винятком out-of-gas.

Якщо все пройшло успішно без збоїв і винятків, усі невикористані gas відшкодовуються відправникові транзакції і затверджується змінений стан.

Ура!

Повідомлення

Виконання транзакції повідомлення подібне до виконання транзакції створення контракту, проте є деякі відмінності.

Виконання повідомлення не містить коду ініціалізації, оскільки облікові записи не створюються. Проте, воно може містити вхідні дані, якщо їх надано відправником. Під час виконання повідомлення також має додатковий компонент з вихідними даними, який використовується, якщо ці дані потрібні для подальших виконань.

Як і зі створенням контракту, якщо виконання транзакції повідомлення припиняється через недостаню кількість gas або через недійсну транзакцію (наприклад, переповнення стеку, недійсний перехід, недійсна інструкція), використані gas відправникові не відшкодовуються. Натомість, використовуються всі невикористані gas: а стан повертається до стану безпосередньо перед передачею балансу.

До найновішого оновлення Ethereum не було способу зупинити або скасувати виконання транзакції так, щоб система не використала всі надані gas. Скажімо, ви авторизували контракт, який видав помилку через те, що відправник не має повноважень виконувати певну транзакцію. У попередніх версіях Ethereum залишок gas все одно був би використаний без відшкодувань відправникові. Однак оновлення Byzantium включає новий код «відкочування», який дозволяє контрактному обліковому запису зупинити виконання і відкотити зміни стану без використання решти gas, а також із можливістю повернути причину збою транзакції. Якщо транзакція припинилася через відкочування стану, невикористані gas повертаються відправникові.

Модель виконання

Тепер ми знаємо послідовність кроків, необхідну для виконання транзакції від початку до кінця. Тепер подивимося, як насправді виконується транзакція в віртуальній машині.

Частина протоколу, яка фактично керує виконанням транзакції, є внутрішньою віртуальною машиною Ethereum, відомою як EVM (Ethereum Virtual Machine).

EVM — це віртуальна машина, повна за Тюрінгом, як зазначалося вище. Єдине обмеження, яке є в EVM, і якого немає в типової машини, повної за Тюрінгом, це те, що EVM внутрішньо обмежена за допомогою gas. Таким чином, загальна кількість обчислень, які можуть бути виконані, внутрішньо обмежена кількістю наданих gas.

Джерело: CMU Більше того, архітектура EVM базується на стеку. Машина зі стековою організацією — це комп’ютер, який для зберігання тимчасових значень використовує стек LIFO.

Розмір кожного елемента стеку EVM становить 256 біт, а максимальний розмір стеку 1024.

EVM має пам’ять, в якій елементи зберігаються як масиви байтів з послівною адресацією. Пам’ять є змінною, тобто не постійною.

Крім того EVM має власне сховище. На відміну від пам’яті, сховище є постійним і розглядається як частина стану системи. EVM зберігає програмний код окремо, в віртуальній пам’яті ROM, доступ до якої можливий лише за допомогою стеціальної інструкції. Таким чином EVM відрізняється від типової vархітектури фон Неймана, в якій прогамний код зберігається у пам’яті або сховищі.

EVM також має власну мову, «байткод EVM». Коли програмісти, як ви чи я, пише смарт-контракт для роботи в Ethereum, зазвичай, використовується мова програмування високого рівня, наприклад Solidity. Після цього його можна компілювати в байткод EVM, який може зрозуміти EVM.

А тепер перейдемо до виконання.

Перед виконанням певного обчислення процесор перевіряє доступність і дійсність такої інформації:

  • стан системи;
  • залишок gas для обчислень;
  • адреса облікового запису, якому належить код, який виконується;
  • адреса відправника транзакції, який ініціював виконання;
  • адреса облікового запису, який запустив виконання коду (може відрізнятися від початкового відправника);
  • ціна gas транзакції, для якої запущено це виконання;
  • вхідні дані для виконання;
  • вартість (у Wei), передана цьому обліковому запису як частина поточного виконання;
  • машинний код для викнання;
  • заголовок поточного блоку;
  • глибина наявного стеку повідомлення або створення контракту.

На початку виконання пам’ять і стек порожні, а значення лічильника програми «0».

PC: 0 STACK: [] MEM: [], STORAGE: {}


Після цього EVM рекурсивно виконує транзакцію, обчислюючи стан системи і стан машини для кожної ітерації циклу. Стан системи — це глобальний стан Ethereum.

Стан машини складається з:

  • доступний gas;
  • лічильник програми;
  • вміст пам’яті;
  • активна кількість слів у пам’яті;
  • вміст стеку.

Елементи стеку додаються або вилучаються з найлівішої частини ряду.

На кожній ітерації циклу від gas, що залишилися, віднімається потрібна кількість і збільшується лічильник програми.

Під час завершення кожної ітерації є три можливості:

  1. Стан винятку машини (наприклад, недостатньо gas, неправильні інструкції, недостатньо елементів стеку, переповнення елементів стеку понад 1024, недійсні місця призначення JUMP/JUMPI тощо), який призводить до зупинки і скасування всіх змін
  2. Продовження послідовності обробки на наступній ітерації
  3. Кероване припинення роботи машини (завершення процесу виконання)

Припускаємо, що виняткової ситуації не відбулося, досягнуто контрольованого нормального завершення, машина згенерувала результуючий стан, залишок gas після виконання, отриманий підстан і кінцевий результат.

Фух.

Ми пройшли через найскладнішу частину Ethereum. Навіть, якщо ви не повністю її зрозуміли, це не страшно. Насправді, вам не потрібно розуміти в деталях, як відбувається виконання, якщо ви не працюєте на дуже глибокому рівні.

Як фіналізується блок

На закінчення подивимося, як фіналізується блок з багатьох транзакцій.

Під словом «фіналізується» можна розуміти дві різні речі, залежно відтого, новий це блок, чи існуючий. Якщо це блок новий, то ми говоримо про процес, необхідний для його майнінгу. Якщо блок існуючий, то мова йтиме про процес його валідації. У будь-якому разі для «фіналізації» блоку є чотири вимоги:

1) Перевірка (чи, у разі майнінгу, визначення) блоків-дядьків

Кожний блок-дядько в заголовку блока має бути дійсним заголовком і знаходитися в межах шести поколінь від поточного блоку.

2) Валідація (чи, у разі майнінгу, визначення) транзакцій

Параметр gasUsed блоку має дорівнювати сумарній кількості gas, використаних транзакціями, переліченими в блоці. (Слід нагадати, що під час виконання транзакції ми відстежуємо лічильник gas блоку, який у свою чергу відстежує загальну кількість gas, використаних всіма транзакціями в блоці).

3) Призначення винагороди (лише в разі майнінгу)

Адреса-бенефіціар отримує 5 Ether за майнінг блоку. (За пропозицією Ethereum EIP-649 цю винагороду 5 ETH незабаром буде зменшено з 5 ETH до 3 ETH). Окрім того, за кожний блок-дядька бенефіціар поточного блоку отримує додаткову винагороду в розмірі 1/32 від винагороди за поточний блок. Нарешті, бенефіціар дядька(-ів) також отримує певну винагороду (для її обчислення існує спеціальна формула).

4) Перевірка (або, в разі майнінгу — обчислення дійсного) стану і параметра nonce.

Переконайтеся, що застосовано всі транзакції й результуючі стани, а тоді визначте новий блок як стан після того, як винагороду за блок додано до кінцевого результату транзакції. Перевірка відбувається порівнянням цього результуючого стану з деревом стану, збереженим у заголовку.

Доказ роботи майнінгу

В розділі «Блоки» коротко описано поняття складності блоку. Алгоритм, за яким визначається значення складності блоку, називається «Доказ роботи» (PoW — Proof of Work).

Алгоритм доказу роботи в Ethereum називається «Ethash» (раніше — Dagger-Hashimoto).

Формально алгоритм визаначається так:

де m це mixHash, n це nonce, Hn є заголовком нового блоку (за винятком компонентів nonce і mixHash , які потрібно обчислювати), Hn — параметр nonce заголовку блоку, а d це DAG*, який є великим набором даних.

У розділі «Блоки*» ми згадували про елементи, які містяться в заголовку блоку.Два з них називалися mixHash і nonce.

Нагадаємо:

  • mixHash — це ****геш, який, у поєднанні з параметром nonce, доводить, що в цьому блоці здійснено достатньо обчислень;
  • nonce — це геш, який, у поєднанні з параметром mixHash, доводить, що в цьому блоці здійснено достатньо обчислень.

Для обчислення цих двох елементів використовується функція PoW.

Як саме обчислюються параметри mixHash і nonce за допомогою функції PoW, — питання дещо складніше. Детальніше ми його розберемо окремою статтею. Але на вищому рівні це працює так: для кожного блоку обчислюється «основа».

Ця основа відрізняється для кожної «епохи», довжина епохи становить 30 000 блоків. Для першої епохи основа є гешем послідовності з 32 байтів нулів. Для кожної наступної епохи вона є гешем гешу попередньої основи. На базі цієї основи вузол може обчислити псевдовипадковий «кеш». Цей кеш уможливлює концепцію «легких вузлів», яку ми обговорювали раніше в цій статті. Легкі вузли дають змогу певним вузлам ефективно перевіряти транзакцію, не перевантажуючи пам’ять зберіганням повного набору даних усього блокчейну. Легкий вузол може перевірити дійсність транзакції на основі виключно кешу, оскільки з кешу можна регенерувати конкретний блок, який потрібно перевірити.

За допомогою кешу вузол може генерувати «набір даних» DAG, кожен елемент якого залежить від невеликої кількості псевдовипадково вибраних елементів кешу. Щоб стати майнером, вам слід генерувати цей повний набір даних; всі повні клієнти і майнери зберігають його, і він зростає лінійно з часом.

Майнери можуть брати випадкові частини цього набору даних і за допомогою математичної функції об’єднувати його в геш у параметр «mixHash». Майнер постійно генерує mixHash, допоки на виході значення не досягає цільового значення nonce. Як тільки цю умову виконано, nonce вважається дійсним, і блок можна додати в ланцюжок.

Майнінг — це механізм безпеки.

Загалом, алгоритм PoW використовується для доведення у криптографічно захищений спосіб, що було здійснено певну кількість обчислень для генерування деякого результату (наприклад, nonce). Це тому, що найкращим способом знайти значення nonce, яке не перевищує заданого порогового значення, є перелічити всі можливі варіанти. Якщо послідовно застосовувати геш-функцію, результат матиме рівномірний розподіл, а отже, в середньому час, потрібний для знаходження такого значення nonce, залежить від порогу складності. Що вища складність, то більше часу потрібно для розв’язку nonce. У такий спосіб алгоритм PoW пояснює концепцію складності, яка використовується для гарантування безпеки блокчейну.

Що таке безпека блокчейну? Це просто: ми хочемо створити блокчейн, якому довіряє КОЖНИЙ. Як уже згадувалося раніше, якщо існує декілька ланцюжків, довіра користувачів втратиться, оскільки неможливо раціонально визначити, який з ланцюжків «дійсний». Щоб група користувачів погодилася з наявним станом, збереженим у блокчейні, потрібно мати єдиний канонічний блокчейн, якому група довіряє.

Саме це робить алгоритм PoW: він гарантує, що конкретний блокчейн залишатиметься канонічним в майбутньому, створюючи майже нездоланні перешкоди для зловмисників, які мають намір створити нові блоки, щоб переписати частину історії (наприклад, стерши певні транзакції чи створивши фейкові) або утворити розгалуження. Щоб такі блоки були валідовані першими, потрібно, щоб значення nonce було розв’язано без суперечностей і швидше, ніж будь які інші в мережі, оскільки користувачі мережі переконані, що їх ланцюжок є найтяжчим (на основі принципів протоколу GHOST, згаданого раніше). Це неможливо, якщо в зловмисника немає понад половини майнінгової потужності мережі, — сценарій, відомий як атака 51%.

Майнінг — це механізм розподілу прибутку

Окрім захисту блокчейну, алгоритм PoW такж розподіляє прибуток між тими користувачами, які витратили свої обчислювальні потужності для забезпечення цього захисту. Нагадаємо, майнер отримує винагороду за майнінг блоку, а саме:

  • фіксована винагорода за блок: 5 Ether за «виграний» блок (незабаром буде змінено на 3 Ether);
  • вартість gas, витрачених на транзакції в блоці;
  • додаткова винагорода за включення блоків-дядьків як частини поточного блока;

Щоб забезпечити довготривалість застосування механізму консенсусу алгоритму PoW для захисту і розподілу прибутку, Ethereum намагається впровадити такі дві властивості:

  • Максимальна доступність для користувачів. Іншими словами, для запуску алгоритму не потрібне спеціалізоване чи нетипове обладнання. Це зроблено для того, щоб модель розподілу прибутку була максимально відкритою, і будь-який користувач міг надати довільну кількість обчислювальних потужностей в обмін на Ether.
  • Максимальне унеможливлення отримання непропорційної вигоди одним вузлом (або невеликим набором). Якщо вузол здатний отримати непропорційно велику вигоду, це означає, що він має великий вплив на визначення канонічного блокчейну. Це проблема, бо ставить під загрозу безпеку мережі.

У мережі блокчейну Bitcoin у зв’язку з наведеними двома властивостями виникла проблема, пов’язана з тим, що алгоритмом PoW є геш-функція SHA256. Слабким місцем такого типу функцій є те, що її можна обчислювати значно ефективніше, використовуючи спеціальне обладнання, відоме як ASICs.

Щоб нейтралізувати цю проблему, алгоритм PoW в Ethereum (Ethhash) послідовно сильно залежить від пам’яті. Це означає, що алгоритм розроблено так, щоб обчислення nonce вимагало великого об’єму пам’яті І пропускної здатності. Задіювання великого об’єму пам’яті ускладнює використоання пам’яті комп’ютера для одночасного обчислення кількох nonce, а вимога до високої пропускної здатності ускладнює одночасне обчислення кількох nonce навіть для надшвидких комп’ютерів. В такий спосіб знижується ризик централізації, і вирівнюються шанси для вузлів, які виконують перевірку.

Однак слід зазначити, що зараз Ethereum переходить від механізму консенсусу PoW до іншого механізму з назвою «доказ ставки». Це окрема неприємна тема, маю надію дослідити її наступним дописом.

☺️

Висновок

…Фух! Ви дійшли до кінця. Сподіваюся.

Я знаю, що в цій статті було багато інформації для переварювання. Якщо вам знадобилося перечитати її декілька разів, щоб усе зрозуміти, це чудово. Мені особисто довелося не один раз перечитати документацію, посібники і різні частини бази коду, щоби в усьому розібратися. Тим не менше, сподіваюся, цей огляд став вам у пригоді.

Якщо ви знайшли помилки або неточності, буду вдячний, якщо напишете мені про це приватним повідомленням або тут в коментарях. Обіцяю, що прочитаю всі ;)

Не забувайте, що я теж людина (так, це правда) і можу допускатися помилок. Цей допис зроблено безкоштовно, на користь спільноти. То ж будьте конструктивними у відгуках, наїзди будуть зайвими.

☺️

[1] https://github.com/ethereum/yellowpaper

Story tags:

Why am I sharing my travel stories?

Founder & CEO of TruStory. I have a passion for understanding things at a fundamental level and sharing it as clearly as possible.

Preethi Kasireddy
LEARN MORE