Потужність алфавіту та інформаційний обсяг тексту – що це таке в інформатиці, як визначити інформаційний вага символу, формула розрахунку

В епоху розвитку комп’ютерних технологій, інформатики, систем числення і багато чого іншого усі перелічені визначення мають неабиякий вплив на життя людини. Більша кількість користувачів не надто повно розбираються в інформатиці, тому з’ясуємо, що означає поняття потужність алфавіту, як її знайти і застосувати.

Що це таке?

Поняття «потужність алфавіту» лежить в основі вивчення інформатики. Численний набір символів прийнято називати — алфавіт. Сума всіх символів вибраної мови називається потужністю. Випливає висновок: потужність алфавіту — це кількість символів, що використовується в обраному мовою. Весь перелік використовуваних значків може містити числа, різного характеру дужки, символи, коми, двокрапки, крапки, пробіл і т. д.

Все ж узагальнене поняття в інформатиці не враховує розрахунки інформаційної величини повідомлення, яке містить знаки пунктуації, цифри та інше. Тут необхідний інший метод. Суть в тому, що окрема літера, цифра або дужка містить власний інформаційний обсяг даних. З цього інформаційного коду мозок комп’ютера пізнає, що було надруковано. Машина обробляє введені дані тільки в двійковому коді у вигляді одиниці і нуля, в цьому і полягає суть комп’ютерної науки.

У результаті виходить, що будь-який символ можна закодувати шляхом різної розстановки нулів і одиниць. Найменша послідовність, яка позначає яку-небудь букву або цифру, містить всього два елемента. Інформаційний вага одного символу прийнято представляти у вигляді стандартної інформаційної одиниці виміру, найменування якої «біт». Вісім бітів дорівнюють одному байту.

Для визначення кількість інформації, що міститься у повідомленні використовують формулу Хартлі: N=2i.

Формула призначена для розрахунку потужності використовуваного мови, яка позначається буквою N (інформаційний вага або об’єм), i – кількість біт (в одиниці слова. Тобто вага символу).

Формулювання теорії про кількість інформації в набраної фразі: I=K*i. Тут До – це кількість символів у повідомленні, I — інформаційна маса значка.

10 найбільш популярних смартфонів всіх часів

Кількість символів, що входять в російський алфавіт — 33 букви. Виходить, що потужність взятого мови N=33. Англійська мова містить 26 букв і його потужність — 26. Але є і клавіатурний мову, що складається з букв російської мови і додаткових символів: 33 літери, 10 чисел, 11 знаків пунктуації, дужки і пробіл = 57.

Як визначити обсяг інформації в тексті?

Зазвичай завжди при наборі тексту можна використовувати жирні, заголовні, і букви з курсивом, знаки пунктуації, різноманітні скоби, операції обчислення і т. д. За розрахунками виходить, що потужність комп’ютерного алфавіту — це 256 символів та варіантів. Слідуючи формулою Хартлі, N=256, тоді маса кожного значка (i) в клавіатурному алфавіті дорівнює восьми бітам, тобто один байт.

Розмір надрукованій фрази потрібно обчислювати за формулою: V=K⋅log2N, N — чисельність символів в алфавіті, а кількість знаків у надрукованій фразі – K. Наприклад, дано текст, який вмістився на 30 сторінках. На кожній з них розташоване за 55 рядків, у них 65 символів. Виходить, що на сторінці 50 х 65= 3 575 байт інформації.

Приклади розрахунку потужності та обсягу

Скільки символів можна закодувати 3 бітами?

1 символ дорівнює 8 бітам, тому закодувати цілі символи не вийде. Можна провести кодування трехбитовых комбінацій. Тоді розрахунок необхідно проводити за формулою Хартлі: N=2i , де i=3. 23=8

Прийнявши інформаційний вага символу за байт, потрібно розрахувати обсяг інформації надрукованого повідомлення:

«Біліє парус одинокий

У тумані моря блакитному»

У наведених двох рядках налічується 43 ініціали (прогалини вважаються, але дужки не враховуються), тоді інформаційний обсяг обчислюється за формулою, яка наведено нижче:

V=43*1 байт=43 байта=43*8 біт=344 біта