Пряма компенсація накладення спектрів у часовій області з застосуванням в області зваженого або вихідного сигналу

 

ОБЛАСТЬ ТЕХНІКИ

Даний винахід відноситься до галузі кодування і декодування звукових сигналів. Зокрема, даний винахід відноситься до пристрою і способу компенсації накладення спектрів у часовій області з використанням передачі додаткової інформації.

РІВЕНЬ ТЕХНІКИ

У рівні техніки при кодуванні звуку використовується частотно-часове розкладання для подання сигналу у вигляді його значущої частини для скорочення кількості даних. Зокрема, в кодерах звукових сигналів використовуються перетворення для виконання відображення вибірок в тимчасовій області коефіцієнти в частотній області. Дискретні часові перетворення, які використовуються для такого відображення часу в частоту, зазвичай ґрунтуються на ядрах синусоїдальних функцій, таких як дискретне перетворення Фур'є (DFT) і дискретне косинусне перетворення (DCT). Можна показати, що при таких перетвореннях досягається ущільнення енергії» звукових сигналів. Це означає, що в області перетворення (або частотній області) розподіл енергії локалізовано на менш значущих коефіцієнтів, ніж у вибірках у часовій області. Виграш від кодування може�у частотній області. У приймачі біти, що представляють квантовані та кодовані параметри (наприклад, коефіцієнти в частотній області), використовуються для відновлення квантованих коефіцієнтів в частотній області (або інших квантованих даних, таких як коефіцієнти підсилення), при цьому зворотне перетворення генерує звуковий сигнал у часовій області. Такі схеми кодування зазвичай називають кодуванням з перетворенням.

За визначенням кодування з перетворенням працює з послідовним блокам вибірок вхідного звукового сигналу. Оскільки квантування вносить деяке спотворення в кожен синтезований блок звукового сигналу, використання неперекривающихся блоків може вносити неоднорідності на межах блоку, що може погіршувати якість звукового сигналу. Тому при кодуванні з перетворенням для того, щоб уникнути неоднорідності, кодовані блоки звукового сигналу перекриваються до застосування дискретного перетворення і відповідним чином віконно зважуються в перекривающемся сегменті для забезпечення плавного переходу від одного декодованого блоку до наступного. Використання «стандартної» перетворення, такого як DFT (або його эквивалентк так званої «некритической вибіркою». Наприклад, якщо взяти типове умова перекриття 50%, кодування блоку з N послідовних вибірок в тимчасовій області фактично вимагає виконання перетворення за 2N послідовним вибіркам - N вибірках від поточного блоку і N вибірках від перекривающейся частини наступного блоку. Тому для кожного блоку з N вибірок в тимчасовій області кодуються 2N коефіцієнтів в частотній області. Критична вибірка в частотній області передбачає, що N вхідних вибірок в тимчасовій області формують тільки N коефіцієнтів в частотній області, що підлягають квантованию і кодування.

Були розроблені спеціалізовані перетворення для забезпечення можливості використання вікон і, тим не менш, підтримки критичних вибірок в області перетворення - щоб 2N вибірок в тимчасовій області на вході перетворення приводили до N коефіцієнтами в частотній області на виході перетворення. Для досягнення цього блок з 2N вибірок в тимчасовій області спочатку скорочується до блоку з N вибірок у часовій області за допомогою спеціальної тимчасової інверсії й підсумовування окремих частин віконно зваженого сигналу довжиною 2N вибірок. Така спеціальна тимчасова інверсія з �пропозиції спектрів в блок сигналу його не можна видалити з використанням тільки цього блоку. Це саме той сигнал з накладенням спектрів у часовій області, який є вхідним для перетворення розміром N (а не 2N), що формує N коефіцієнтів перетворення в частотній області. Для відновлення N вибірок в тимчасовій області при зворотному перетворенні фактично повинні використовуватися коефіцієнти перетворення від двох наступних і вікон для компенсації TDA в ході процесу, званого компенсацією накладення спектрів у часовій області, або TDAC.

Прикладом такого перетворення із застосуванням TDAC, яке широко застосовується при звуковому кодуванні, є модифіковане дискретне косинусне перетворення (або MDCT). Фактично MDCT реалізує вищезазначене TDA без явного згортання у часовій області. Швидше, накладення спектрів у часовій області вноситься при аналізі як прямого, так і зворотного MDCT (IMDCT) одного блоку. Це виникає в результаті математичного побудови MDCT і добре відомо фахівцям в даній області техніки. Але відомо також, що це накладення спектрів у часовій області може розглядатися як еквівалентне спочатку инвертированию частин вибірок у часовій області, а потім підсумовування цих инвертиѻема виникає, коли кодер звукових сигналів перемикається між двома моделями кодування: однією з використанням TDAC і інший без використання. Припустимо, наприклад, що кодек перемикається між моделлю кодування TDAC і моделлю кодування не-TDAC. Та сторона блоку вибірок, кодованого з використанням моделі кодування TDAC, яка є спільною з блоком, кодованих без використання TDAC, містить накладення спектрів, яку не можна компенсувати з використанням блоку вибірок, кодованого з використанням моделі кодування не-TDAC.

Перше рішення полягає у виключенні вибірок, що містять накладення спектрів, яке не може бути скомпенсоване.

Таке рішення призводить до неефективного використання смуги пропускання, оскільки блок вибірок, для якого TDA не може бути компенсовано, кодується двічі: один раз кодеком на основі TDAC і другий раз кодеком не на основі TDAC.

Друге рішення полягає у використанні спеціально розроблених вікон, які не вносять TDA, щонайменше, в одній частині вікна, коли застосовується процес часової інверсії і підсумовування. Фіг. 1 являє собою схему приклад вікна, що TDA зі свого лівого боку, але не вносить TDA зі своєю пр�дно для переходів від кодека на основі TDAC до кодеку не на основі TDAC. Перша половина цього вікна формується таким чином, що вона вносить TDA 110, яке може бути скомпенсоване, якщо в попередньому вікні також використовується TDA без перекриття. Однак з правого боку вікна на фіг. 1 є вибірка з нульовим значенням 120 після точки згортання в положенні 3N/2. Тому ця частина вікна 100 не вносить ніякого TDA, коли процес часової інверсії і підсумовування (або згортання) виконується навколо точки згортання в положенні 3N/2.

Крім того, ліва сторона вікна 100 містить плоску область 130, якій передує клиноподібна область 140. Призначення клиноподібної області 140 полягає в забезпеченні хорошого спектрального дозволу при обчисленні перетворення і згладжуванні переходу під час операцій перекриття і підсумовування між суміжними блоками. Збільшення тривалості плоскої області 130 вікна скорочує смугу частот інформації і зменшує спектральну ефективність вікна, оскільки частина вікна відправляється без якої-небудь інформації.

У многорежимном Аудіокодек уніфікованого мовного і аудіокодека (USAC) Групи експертів по рухомих зображень (MPEG) використовуються кілька спеціальних вікон, таких як вікно, наведене на фіг. 1, для управління різними�епрямоугольних вікон. Такі спеціальні вікна були розроблені для досягнення різних компромісів між спектральним дозволом, скороченням витрат даних і плавністю переходу між зазначеними різними типами кадрів.

СУТНІСТЬ ВИНАХОДУ

Отже, існує потреба у методі компенсації накладення спектрів для забезпечення перемикання між режимами кодування, причому даний метод компенсує ефекти накладання спектрів в точці перемикання між вказаними режимами.

У зв'язку з цим у відповідності з цим винаходом пропонується спосіб прямої компенсації накладення спектрів у часовій області у кодованому сигналі, прийнятому у растровому потоці в декодері. Цей спосіб містить прийом в растровому потоці в декодері від кодера додаткової інформації, що відноситься до корекції накладення спектрів у часовій області в кодованої сигналі. У декодері накладення спектрів у часовій області компенсується у кодованому сигнал у відповідь на додаткову інформацію.

У відповідності з цим винаходом пропонується також спосіб прямої компенсації накладення спектрів у часовій області у кодованому сигнал для передачі від кодера до декодера. �ктров у часовій області у кодованому сигналі. Додаткова інформація, що відноситься до корекції накладення спектрів у часовій області у кодованому сигналі, відправляється в растровому потік від кодера до декодера.

У відповідності з цим изобретениемпредлагается також пристрій для прямої компенсації накладення спектрів у часовій області у кодованому сигналі, прийнятому у растровому потоці. Пристрій містить приймач для прийому в растровому потік від кодера додаткової інформації, що відноситься до корекції накладення спектрів у часовій області у кодованому сигналі. Пристрій також містить компенсатор накладення спектрів у часовій області у кодованому сигнал у відповідь на додаткову інформацію.

Крім того, даний винахід відноситься до пристрою для прямої компенсації накладення спектрів у часовій області у кодованому сигнал для передачі в декодер. Пристрій містить обчислювач додаткової інформації, що відноситься до корекції накладення спектрів у часовій області у кодованому сигналі. Пристрій також містить передавач для відправки в растровому потоці на декодер додаткової інформації, що відноситься до корекції накладення спектрів у часовій області в кодированноьного опису ілюстративних варіантів здійснення винаходу, наведених лише в якості прикладу з посиланнями на прикладені креслення.

КОРОТКИЙ ОПИС КРЕСЛЕНЬ

Варіанти здійснення даного винаходу описуються лише в якості прикладу з посиланням на додані креслення, на яких:

Фіг. 1 являє собою схему приклад вікна, що TDA зі свого лівого боку, але не вносить TDA зі своєї правої сторони;

фіг. 2 являє собою схему приклад переходу від блоку з використанням неперекривающегося прямокутного вікна до блоку з використанням перекривающегося вікна;

фіг. 3 являє собою схему, на якій показано згортання і TDA стосовно до схеми, показаної на фіг. 2;

фіг. 4 представляє собою схему, на якій показана пряма корекція накладення спектрів стосовно до схеми, показаної на фіг. 2;

фіг. 5 являє собою схему, на якій показано несвернутая пряма корекція компенсації накладення спектрів (FAC) (ліворуч) і згорнута корекція FAC (праворуч);

фіг. 6 являє собою ілюстрацію першого застосування способу корекції FAC з використанням MDCT;

фіг. 7 являє собою схему корекції FAC з використанням інформації з режиму ACELP;

фіг. 8 являє собою схему корекції FAC, застосовуючи�ося прямокутного вікна;

фіг. 9 являє собою схему несвернутой корекції FAC (ліворуч) і згорнутої корекції FAC (праворуч);

фіг. 10 являє собою ілюстрацію застосування другого способу корекції FAC з використанням MDCT;

фіг. 11 являє собою блок-схему квантування FAC, що включає в себе корекцію помилок ТШХ;

фіг. 12 являє собою схему різних випадків використання корекції FAC в многорежимной системі кодування;

фіг. 13 являє собою схему іншого випадку використання корекції FAC в многорежимной системі кодування;

фіг. 14 являє собою схему першого випадку використання корекції FAC при перемиканні між короткими кадрами з перетворенням і кадрами ACELP;

фіг. 15 являє собою схему другого випадку використання корекції FAC при перемиканні між короткими кадрами з перетворенням і кадрами ACELP;

фіг. 16 являє собою блок-схему прикладу пристрої для прямої компенсації накладення спектрів у часовій області у кодованому сигналі, прийнятому у растровому потоці;

фіг. 17 являє собою блок-схему прикладу пристрої для прямої компенсації накладення спектрів у часовій області у кодованому сигнал для передачі на декодер.

<иия спектрів в тимчасовій області і зважування за допомогою непрямоугольного вікна при кодуванні звукового сигналу з використанням як перекриваються, так і неперекривающихся вікон в суміжних кадрах. При використанні описаної тут технології можна уникнути використання спеціальних неоптимальних вікон, в той же час забезпечуючи належне управління переходами кадрів в моделі з використанням як прямокутних неперекривающихся вікон, так і непрямоугольних вікон.

Прикладом кадру з використанням зважування за допомогою прямокутного неперекривающегося вікна є кодування з лінійним передбаченням (LP) і, зокрема, лінійне передбачення з алгебраїчним кодовою збудженням (ACELP). В альтернативному прикладі здійснення прикладом зважування за допомогою непрямоугольного перекривающегося вікна є кодування з перетворенням кодованого збудження (ТШХ), що застосовується в Уніфікованому мовному кодеку і аудіокодек (USAC), в якому в кадрах ТШХ використовуються як накладання кадри, так і модифіковане дискретне косинусне перетворення (MDCT), яке вносить накладення спектрів у часовій області (TDA). USAC також є типовим прикладом, в якому суміжні кадри можуть кодуватися з використанням або прямокутних неперекривающихся вікон, як, наприклад, у кадрах ACELP, або непрямоугольнирба для спільності в цьому описі при цьому розглядається конкретний приклад USAC для ілюстрації переваг пропонованих системи і способу.

Розглядаються два окремих випадки. Перший випадок має місце, коли здійснюється перехід від кадру з використанням прямокутного неперекривающегося вікна до кадру з використанням непрямоугольного перекривающегося вікна. Другий випадок має місце, коли здійснюється перехід від кадру з використанням непрямоугольного перекривающегося вікна до кадру з використанням прямокутного неперекривающегося вікна. З метою ілюстрації і без припущення обмеження кадри з використанням прямокутного неперекривающегося вікна можуть кодуватися з використанням моделі ACELP, а кадри з використанням непрямоугольного перекривающегося вікна можуть кодуватися з використанням моделі ТШХ. Крім того, для деяких кадрів використовуються конкретні величини тривалості, наприклад, 20 мілісекунд кадру ТШХ, позначаються ТСХ20. Однак слід пам'ятати, що ці конкретні приклади використовуються з метою ілюстрації, але що можуть передбачатися й інші значення тривалості і типи кодування, відмінні від ACELP і ТШХ.

Нижче розглядається випадок переходу від кадру з використанням прямокутного неперекривающегося вікна до кадру з використанням непрямоугольного перекривающе�ї схему приклад переходу від блоку з використанням неперекривающегося прямокутного вікна до блоку з використанням перекривающегося вікна.

Згідно з фіг. 2, типове прямокутне неперекривающееся вікно містить кадр 202 ACELP, а типове непрямоугольное накладається вікно містить кадр 206 ТСХ20. ТСХ20 відноситься до коротких кадрів ТШХ в USAC, які номінально мають тривалість 20 мс, так само як і кадри ACELP у багатьох областях застосування. На фіг. 2 показано, які вибірки використовуються в кожному кадрі і як вони віконно зважуються в кодері. Те ж вікно 204 застосовується в декодері, так що сумарний ефект, спостережуваний в декодері, являє собою квадрат форми вікна, показаного на фіг. 2. Зрозуміло, таке подвійне віконне зважування - один раз в кодері і другий раз в декодері - є типовим при кодуванні з перетворенням. У тих випадках, коли вікно не зображено, як у кадрі 202 ACELP, це фактично означає, що для даного кадру використовується прямокутне вікно. Непрямоугольное вікно 204 для кадру 206 ТСХ20, показане на фіг. 2, вибирається таким чином, що якщо в попередніх і наступних кадрах також використовуються накладання і неперекривающиеся вікна, що перекриваються ділянки 204а і 204b вікон після другого віконного зважування в декодері є доповнюючими і дозволяють відновлювати «незважений за допомогою вікна» сигн�ок в ток спектрів у часовій області (TDA) зазвичай застосовується до віконно зваженим вибірках для даного кадру 206 ТСХ20. Зокрема, лівий 204а і правий 204b ділянки згортаються і об'єднуються. Фіг. 3 являє собою схему, на якій показано згортання і TDA стосовно до схеми, показаної на фіг. 2. Непрямоугольное вікно 204, введене в опис фіг. 2, показано у вигляді чотирьох чвертей. 1-я і 4-я чверті - 204а і 204d вікна 204 - показані пунктирною лінією, оскільки вони об'єднуються з 2-ї і 3-ї чвертями 204b, 204c, показані суцільною лінією. Об'єднання 1-ї та 4-ї чверті 204а, 204d з 2-ї і 3-ї чвертями 204b, 204c здійснюється в ході процесу, аналогічного процесу, що використовується при кодуванні MDCT, наступним чином. 1-я чверть 204а реверсують в часі, потім вона послідовно повиборочно вирівнюється з 2-ї чвертю 204b вікна і, нарешті, реверсированная у часі і зрушена 1-я чверть 204е віднімається з 2-ї чверті 204b вікна. Аналогічним чином 4-я чверть 204d вікна реверсують у часі і зсувається (204f) для вирівнювання з 3-ї чвертю 204с вікна і, нарешті, вона підсумовується з 3-ї чвертю 204с вікна. Якщо у вікні 204 ТСХ20, показаному на фіг. 2, є 2Nвибірок, то в кінці цього процесу ми отримуємоNвибірок, що проходять в точності від початку до кінця зображеного на фіг. 3 кадру 206 ТСХ20. Потім зазначеніNвибо�ня. При використанні спеціального накладення спектрів у часовій області, описаного на фіг. 3, MDCT може бути перетворенням, використовуваних для цієї мети.

Після об'єднання реверсированних у часі і зсунутих ділянок вікна, описаного на фіг. 3, вже неможливо відновити вихідні вибірки в тимчасовій області в кадрі ТСХ20, оскільки вони змішуються з реверсированними у часі версіями вибірок за межами кадру ТСХ20. В кодері звукових сигналів на основі MDCT, такому як MPEG AAC, в якому всі кадри кодуються з використанням одного і того ж перетворення і вікон, таке накладення спектрів у часовій області може бути скомпенсоване, при цьому вибірки звукових сигналів можуть бути відновлені шляхом використання двох послідовних перекриваються кадрів. Однак коли в суміжних кадрах не використовується один і той же процес віконного зважування і перекриття, як на фіг. 2, на якій кадру ТСХ20 передує кадр ACELP, ефект непрямоугольного вікна і накладення спектрів у часовій області не може бути виключений з використанням інформації з попереднього кадру ACELP і наступного кадру ТСХ20.

Вище були представлені методи управління переходом т� підході не використовуються неоптимальні і асиметричні вікна в кадрі, в якому використовується кодування в області перетворень на основі MDCT. Замість цього введені тут способи і пристрої дозволяють використовувати симетричні вікна з центром у середині кодованого кадру, такого як, наприклад, зображений на фіг. 3 кадр ТСХ20, і з 50%-ним перекриттям з кадрами, кодованими з використанням MDCT, в яких також використовуються непрямокутні вікна. Таким чином, у введених тут способи і пристрої пропонується відправляти від кодера до декодера в якості додаткової інформації у растровому потоці корекцію для компенсації ефекту віконного зважування і накладення спектрів у часовій області при переключенні від кадрів, кодованих з прямокутним неперекривающимся вікном, до кадрів, кодованих з непрямоугольним вікон вікном, і навпаки. При таких переходах можливі кілька випадків.

На фіг. 2 зважування за допомогою прямокутного неперекривающегося вікна показано для кадру ACELP, а зважування за допомогою непрямоугольного перекривающегося вікна показано для кадру ТСХ20. При використанні TDA, введеного на фіг. 3, декодер, що приймає спочатку біти від кадру ACELP, має достатньо інформації для повного декодування даного кадру ACELP вп�орок в кадрі ТСХ20 порушується з-за ефекту накладання спектрів, викликаного наявністю попереднього кадру ACELP. Якщо в наступному кадрі також використовується накладається вікно, то зважування за допомогою непрямоугольного вікна і TDA, введене в кодері, може компенсуватися у другій половині показаного кадру ТСХ20, і ці вибірки можуть бути належним чином декодованими. Отже, у першій половині кадру ТСХ20, в якому реверсированная у часі і зрушена 1-я чверть 204е віднімається з 204b на фіг. 3, ефект непрямоугольного вікна і TDA, введене в кодері, не можуть компенсуватися, оскільки в попередньому кадрі ACELP використовується неперекривающееся вікно. Тому в введених тут способи і пристрої пропонується передавати інформацію - Пряму компенсацію накладення спектрів у часовій області (FAC) - для компенсації зазначених ефектів, та належним чином відновлювати першу половину кадру ТСХ20.

Фіг. 4 представляє собою схему, на якій показана пряма корекція накладення спектрів (FAC) стосовно до схеми, показаної на фіг. 2. На фіг. 4 ілюструється ситуація в декодері, при якій зважування за допомогою вікна, наприклад, косинусоїдального вікна, застосовуваного при MDCT, вже застосовувалося вдруге після зворотного перетворення. Рассматрикоторих застосовується корекція FAC, відповідають першій половині кадру ТСХ20. Це те, що називається зоною 402 FAC. Є два ефекти, які компенсуються за допомогою FAC в даному прикладі. Першим ефектом є ефект віконного зважування, званий x_w 404 на фіг. 4. Це відповідає множенню вибірок в першій половині кадру 206 ТСХ20 на 2-ма чверть 204b непрямоугольного вікна на фіг. 3. Тому перша частина корекції FAC містить додаток доповнення цих віконно зважених вибірок, що відповідає корекції для сегмента x_w 406 на фіг. 4. Наприклад, якщо дана вхідна вибірка x[n] множилася на віконну вибірку w[n] в кодері, то доповнення цієї віконно зваженої вибірки просто дорівнює величині (1-w[n]), помноженої на x[n]. Сума x_w 404 і корекція для x_w 406 дорівнює 1 для всіх вибірок в даному сегменті. Друга частина корекції FAC відповідає компоненті накладення спектрів у часовій області, яка додавалася в кодері в кадрі ТСХ20. Для виключення цієї компоненти накладення спектрів, іменованої частиною накладення спектрів х_а 408 на фіг. 4, корекція для х_а 406 на фіг. 4 інвертується в часі, вирівнюється з першою половиною кадру ТСХ20 і підсумовується із зазначеною першою половиною сегмента, показаної як частина накладення спектрів х_а 408. Вона суммир�області, включала в себе віднімання даної компоненти, тому для виключення їх вона тепер знову додається. Сума зазначених двох частин - компенсації вікна x_w 404 і компенсації накладення спектрів х_а 408 утворює повну корекцію FAC в зоні 402 FAC.

Існує кілька варіантів кодування корекції FAC. Фіг. 5 являє собою схему, на якій показано несвернутая корекція FAC (ліворуч) і згорнута корекція FAC (праворуч). Одним з варіантів може бути пряме кодування віконно зваженого FAC сигналу, як показано з лівого боку на фіг. 5. Даний сигнал, іменований вікном 502 FAC на фіг. 5, двічі перекриває довжину зони FAC. У декодері декодований віконно зважений FAC сигнал може далі бути згорнутий (інвертування у часі лівої половини і підсумовування її з правою половиною), а потім цей згорнутий сигнал може бути доданий в якості корекції 504 в зоні 402 FAC, як показано з правої сторони на фіг. 5. У даному підході вибірки у часовій області кодуються двічі в порівнянні з довжиною корекції.

Інший підхід до кодування сигналу корекції FAC, показаного зліва на фіг. 5, полягає у виконанні згортання в кодері до кодування сигналу. Це призводить до свернутому сигналу праворуч на фіг. 5, причому левзвешенного FAC сигналу. Потім до цього свернутому сигналу може бути застосоване кодування з перетворенням з використанням, наприклад, DCT. У декодері декодований згорнутий сигнал може бути просто доданий до зони FAC, оскільки згортання вже було застосовано в кодері. Такий підхід дозволяє виконувати кодування того ж числа вибірок у часовій області, що і довжина зони FAC, що призводить до кодування з перетворенням з формуванням критичних вибірок.

Ще один підхід до кодування сигналу корекції FAC, показаного зліва на фіг. 5, полягає у використанні неявної згортання MDCT. Фіг. 6 являє собою ілюстрацію першого застосування способу корекції FAC з використанням MDCT. У верхньому лівому квадранті показано вміст вікна 502 FAC з незначною зміною. Зокрема, остання чверть вікна 502а FAC зрушена вліво від вікна 502 FAC і инвертирована по знаку (502b). Іншими словами, вікно FAC на фіг. 5 циклічно повертається вправо на ¼ від його повної довжини, а потім знак першої ¼ вибірок інвертується. Потім до віконно зваженого сигналу застосовується MDCT. MDCT за своєю математичної конструкції неявно застосовує операцію згортання, що призводить до свернутому сигналу 602, показаному в верхньому правому квадрантеавляется згорнутий сегмент. Порівнюючи результуючий згорнутий сигнал 602 з повною корекцією 504 FAC на фіг. 5, можна побачити, що він еквівалентний корекції 504 FAC, за винятком інверсії в часі. Таким чином, в декодері після зворотного MDCT (IMDCT) цей сигнал 602, який є інвертованим сигналом корекції FAC, інвертується у часі (або дзеркально відбивається) і стає сигналом 604 корекції FAC, як показано в правому нижньому квадранті фіг. 6. Як зазначено вище, ця корекція 604 FAC може додаватися до сигналу в зоні FAC фіг. 4.

У конкретному випадку переходу від кадру ACELP до кадру ТШХ додаткова ефективність може бути досягнута за рахунок використання інформації, наявної в декодері. Фіг. 7 являє собою схему корекції FAC з використанням інформації режиму ACELP. Синтезований сигнал 702 ACELP аж до кінця кадру 202 ACELP відомий в декодері. Крім того, відгук при відсутності вхідного сигналу (ZIR) 704 синтезує фільтра має хорошу кореляцію з сигналом до початку кадру 206 ТСХ20. Ця особливість вже використовувалася в стандарті 3GPP AMR-WB+ для управління переходами від кадрів ACELP до кадрів ТШХ. Тут ця інформація використовується в двох цілях: 1) для зниження амплітуди сигналу, що підлягає кодуванню в якості кор�ого сигналу помилки. Згідно з фіг. 7, сигнал 706 корекції, що підлягає кодуванню для передачі корекції FAC, обчислюється наступним чином. Перша половина цього сигналу 706 корекції, яка проходить до кінця кадру 202 ACELP, береться як різниця 708 між зваженим сигналом 710 у вихідній некодованим області і виваженим синтезованим сигналом 702 в кадрі 202 ACELP. Беручи до уваги, що модуль кодування ACELP має достатні характеристики, ця перша половина сигналу 706 корекції має меншу енергію і амплітуду в порівнянні з вихідним сигналом. Далі, що стосується другої половини цього сигналу 706 корекції, береться різниця 708 між зваженим сигналом 712 у вихідній некодованим області на початку кадру 206 ТСХ20 і відгуком при відсутності вхідного сигналу 704 вісового синтезує фільтра ACELP. Оскільки відгук при відсутності вхідного сигналу 704 коррелирован з виваженим сигналом 712, принаймні, в деякій мірі, особливо на початку кадру ТСХ20, зазначена різниця має меншу амплітуду і енергію порівняно з виваженим сигналом 712 на початку кадру ТСХ20. Така ефективність відгуку при відсутності вхідного сигналу 704 при моделюванні вихідного сигналу зазвичай вище у началена FAC, форма другої половини сигналу 706 корекції на фіг. 7 повинна прагнути до нуля на початку і в кінці, при цьому, можливо, більше енергії концентрується в середині другої половини вікна 502 FAC в залежності від точності відповідності ZIR зваженого сигналу. Після виконання цих операцій віконного зважування і розрізнення, як описано стосовно фіг. 7, результуючий сигнал 706 корекції може кодуватися, як описано на фіг. 5 або 6, або будь-яким заданим способом кодування FAC-сигналу. У декодері фактичний сигнал корекції FAC знову обчислюється спочатку декодуванням переданого сигналу 706 корекції, описаного вище, а потім знову підсумовуванням синтезованого сигналу 702 ACELP з сигналом 706 у першій половині вікна 502 FAC і підсумовуванням ZIR 704 з тим же сигналом 706 у другій половині вікна 502 FAC.

Досі в цьому винаході описувалися переходи від кадру з використанням прямокутного неперекривающегося вікна до кадру з використанням непрямоугольного перекривающегося вікна на прикладі випадку переходу від кадру ACELP до кадру ТШХ. Слід розуміти, що може виникнути протилежна ситуація, а саме перехід від кадру ТШХ до кадру ACELP. Фіг. 8 являє собою схему корекції FAC, застосовуваної п�екривающегося прямокутного вікна. На фіг. 8 показаний кадр 802 ТСХ20, за яким слід кадр 804 ACELP, зі згорнутим вікном 806 ТСХ20, як видно в декодері, в кадрі ТШХ. На фіг. 8 також показана зона 810 FAC, в якій корекція FAC застосовується для компенсації ефекту віконного зважування і накладення спектрів у часовій області в кінці кадру 802 ТСХ20. Слід зазначити, що кадр 804 ACELP не несе інформації для компенсації зазначених ефектів. Вікно 812 FAC є симетричним відносно вікна 502 FAC на фіг. 5.

Згортання двох частин - 812-й лівої та 812-й правою - вікна 812 FAC при цьому показано у випадку переходу від кадру ТШХ до кадру ACELP. Порівняно з фіг. 5 є наступні відмінності: вікно 812 FAC в даному випадку реверсировано в часі, а згортання частині накладення спектрів застосовується до операції віднімання замість підсумовування, як показано на фіг. 5, щоб узгоджуватися зі знаком згортання MDCT у цій частині вікна.

Фіг. 9 являє собою схему несвернутой корекції FAC (ліворуч) і згорнутої корекції FAC (праворуч). Вікно 812 FAC відтворено на лівій стороні фіг. 9. Сигнал 902 згорнутої корекції FAC може кодуватися з використанням DCT або будь-якого іншого відповідного способу. Якщо виходити з вікна Хеннінга в перетворенні, яке использовалос�н іншої форми інші рівняння використовуються для опису вікна FAC. Крім того, використання вікна типу Хеннінга в MDCT означає, що перед MDCT в кодері використовується косинусоидальное вікно, а в декодері після IMDCT знову використовується косинусоидальное вікно. Саме повиборочная комбінація цих двох косинусоїдальних вікон призводить до необхідної формі вікна Хеннінга, яка має відповідну доповнюючу форму для перекриття і підсумовування у частині вікна з 50%-ним перекриттям.

І знову, підхід з MDCT також може використовуватися для кодування вікна FAC, як описувалося на фіг. 6. Фіг. 10 являє собою ілюстрацію застосування другого способу корекції FAC з використанням MDCT. У верхньому лівому квадранті на фіг. 10 показано вікно 812 FAC, зображене на фіг. 8. Перша чверть 812а вікна 812 FAC зрушена вправо від вікна FAC і инвертирована по знаку (812b). Іншими словами, вікно 812 FAC циклічно повертається вліво на ¼ від його повної довжини, а потім знак останньої ¼ вибірок інвертується. Потім до цього віконно зваженого сигналу у верхньому правому квадранті фіг. 10 застосовується MDCT. MDCT застосовує всередині операцію згортання, що призводить до свернутому сигналу 1002, показаному у верхньому правому квадранті фіг. 10. Таке згортання в MDCT застосовує інверсію знака в лівій частині 812с, але не в правій частині 812b,іі FAC з правої сторони на фіг. 9, можна побачити, що він еквівалентний, за винятком інвертування у часі (віддзеркалення) та інверсії знаку. Таким чином, в декодері після IMDCT цей сигнал 1002, який є інвертованій корекцією FAC, інвертується у часі (або дзеркально відбивається), інвертується за знаком і стає корекцією 1004 FAC, як показано в правому нижньому квадранті фіг. 10. Як зазначено вище, ця корекція 1004 FAC може додаватися до сигналу в зоні FAC фіг. 8.

Квантування сигналу, відповідного корекції FAC, передбачає належне виконання. Дійсно, корекція FAC є частиною кодованого в області перетворень сигналу, включаючи, наприклад, кадри ТСХ20, використовувані в прикладах на фіг. 2-10, оскільки вона додається до кадру для компенсації ефектів віконного зважування і накладення спектрів. Оскільки квантування такої корекції FAC вносить спотворення, дане спотворення керується таким чином, що воно належним чином змішується з кодованим в області перетворень сигналом або узгоджується з його викривленням і не вносить звукові артефакти в даний перехід, відповідний зоні FAC. Якщо викликається квантуванням рівень шуму, а також форма шуму квантування у часовій та годину�ристанням кадрі, в якому застосовується корекція FAC, то корекція FAC не вносить додаткової спотворення.

Є кілька підходів до квантованию сигналу корекції FAC, включаючи як неограничивающих прикладів скалярне квантування, векторне квантування, стохастичні кодові книги, алгебраїчні кодові книги і т. п. В кожному випадку слід розуміти, що є сильна кореляція в атрибутах коефіцієнтів корекції FAC і коефіцієнти відповідного кодованого в області перетворень кадру, як у прикладі кадру ТСХ20. Дійсно, вибірки у часовій області, що використовуються в зоні FAC, повинні бути тими ж, що і вибірки у часовій області на початку кодованого в області перетворень кадру. Таким чином, фактори масштабування, використовувані в пристрої квантування, застосовуваному до кодованому в області перетворень кадру, є приблизно такими ж, що і фактори масштабування, використовувані в пристрої квантування, застосовуваному до корекції FAC. Зрозуміло, число вибірок, або коефіцієнтів в частотній області, корекції FAC є не зовсім таким, як у кодованому в області перетворень кадрі: кодований в області перетворень кадр має більше виборрживать той же рівень шуму квантування на коефіцієнт в частотній області в сигналі корекції FAC, як і у відповідному кодованому в області перетворень кадрі (наприклад, кадрі ТСХ20).

Розглядаючи конкретний приклад Алгебраїчного методу векторного квантування (AVQ), використовуваного в стандарті кодування звукових сигналів 3GPP AMR-WB+ для квантування спектральних коефіцієнтів, і застосовуючи його до квантованию корекції FAC, можна отримати наступний результат. Загальний коефіцієнт посилення при AVQ, розрахований при квантуванні кодованого в області перетворень кадру, наприклад, кадру ТСХ20, причому цей загальний коефіцієнт підсилення використовується для масштабування амплітуд коефіцієнтів в частотній області з метою підтримання витрати біт нижче заданого бітового бюджету, може бути еталонним коефіцієнтом підсилення для використання при квантуванні кадру FAC. Це відноситься також до будь-яких інших факторів масштабування, наприклад, до факторів масштабування, використовуваним в Адаптивному підсилювачі низьких частот (ALFE), таким як використовуються в стандарті AMR-WB+. Інші приклади включають в себе фактори масштабування при кодуванні ААС. В даній категорії також можуть розглядатися будь-які інші фактори масштабування, які управляють рівнем шуму і формою спектру.

В залежність�ром і корекцією FAC застосовується відображення зазначених параметрів факторів масштабуванняm1. Наприклад, у разі, у якому використовуються три довжини кадру ТШХ - 20 мс, 40 мс або 80 мс, як в аудіокодек MPEG USAC, фактори масштабування, такі як, наприклад, фактори масштабування, використовувані в ALFE, використовувані дляmпослідовних спектральних коефіцієнтів у кодованому в області перетворень кадрі, можуть використовуватися для 1 спектрального коефіцієнта корекції FAC.

Для узгодження рівня помилок квантування корекції FAC з рівнем помилок квантування кодованого з перетворенням кадру доцільно враховувати в кодері помилку кодування віконно зваженого кодованого з перетворенням кадру. Фіг. 11 являє собою блок-схему квантування FAC, що включає в себе корекцію помилок ТШХ. Спочатку обчислюється різниця 1102 між віконно виваженим і згорнутим сигналом в кадрі 1104 ТШХ та віконно виваженим і згорнутим ТШХ синтезом цього кадру 1106. ТШХ синтез 1106 у даному контексті - це просто зворотне перетворення - включаючи віконне зважування, застосовуване в декодері - квантованих коефіцієнтів в області перетворення даного кадру ТШХ. Потім різницевий сигнал 1108, або помилка кодування ТШХ, додається 1110 до сигналу 1112 корекції FAC, синхронизованному з зоно�антуется квантователем 1116 для передачі в декодер. У зв'язку з цим, такий квантованний сигнал 1118 корекції FAC, згідно з фіг. 11, коригує в декодері ефект віконного зважування і ефект накладення спектрів, а також помилки кодування ТШХ в зоні FAC. Використання факторів 1120 масштабування, як показано на фіг. 11, дозволяє узгоджувати спотворення корекції FAC з викривленням в кадрі ТШХ.

Фіг. 12 являє собою схему випадку використання корекції FAC в многорежимной системі кодування. Представлені приклади, на яких показано перемикання між вікнами звичайної форми з перекриттям 50% або більше і вікнами змінної форми, включаючи вікна FAC. На фіг. 12 нижню частину можна розглядати як продовження верхній частині по осі часу. На фіг. 12 передбачається, що всі кадри кодуються після попередньої обробки вхідного звукового сигналу з допомогою варіюється в часі процесу фільтрації, яким може бути, наприклад, ваговий фільтр, що отримується в результаті LPC-аналізу вхідного сигналу або яка-небудь інша обробка з допомогою зважування вхідного сигналу. В даному прикладі вхідний сигнал кодується аж до «Точки А перемикання» з використанням такого підходу з сімейства сучасних методів кодування звукових �то означає використання вікон з перекриттям 50% і звичайної форми, як в косинусоидальном вікні, що використовується при кодуванні з MDCT, хоча для цієї мети можуть використовуватися і вікна іншої форми. Далі, між Точкою А перемикання» і «Точкою В перемикання» вхідний сигнал кодується з використанням вікна змінної довжини і форми, не обов'язково оптимізованого для кодування в області перетворень, а скоріше призначений для досягнення певного компромісу між часовим і частотним дозволом для режимів кодування, використовуваних в даному сегменті. Фіг. 12 показує конкретний приклад режимів кодування ACELP та ТШХ, що використовуються в даному сегменті. Видно, що форми вікон для даних режимів кодування, значною мірою, є різнорідними і варіюються за формою і довжині. Вікно ACELP є прямокутним і неперекривающимся, в той час як вікно для ТШХ є непрямоугольним і вікон. Саме в цьому випадку вікно FAC використовується для компенсації накладення спектрів у часовій області, як описувалося вище. Саме вікно FAC, показане жирним на фіг. 12, при його особливою формою і довжині, є одним з вікон змінної форми, укладеними в сегменті між Точкою А перемикання» і «Точкою В перемикання».

Фіг. 13 являє собо� вікно FAC може використовуватися в контексті, в якому кодер локально перемикається з вікон звичайної форми на вікна змінної форми для кодування короткочасного сигналу. Це аналогічно контексту кодування ААС, при якому вікно запуску і зупинки застосовується для локального використання вікон з забезпеченням меншого часу на кодування короткочасного сигналу. В даному випадку замість цього, згідно з фіг. 13, сигнал між Точкою А перемикання» і «точкою В перемикання», який передбачається короткочасним, кодується з використанням многорежимного кодування, що включає в себе ACELP і ТШХ в представленому прикладі, що вимагає використання вікна FAC для належного управління переходом при використанні способу кодування ACELP.

Фіг. 14 і 15 являють собою схеми першого і другого випадків використання корекції FAC при перемиканні між короткими кадрами з перетворенням і кадрами ACELP. Це випадки, в яких виконується перемикання між короткими кадрами з перетворенням в області LPC, наприклад, короткими кадрами ТШХ, і кадрами ACELP. Представлений на фіг. 14 і 15 приклад можна розглядати як локальну ситуацію в більш тривалому сигналі, в якій також можуть використовуватися інші режими кодир�ь перекриття понад 50%. Наприклад, це може мати місце в кодеку ААС з малою затримкою, в якому використовується довге асиметричне вікно. У цьому випадку деякі спеціальні вікна запуску і зупинки призначені для забезпечення належного перемикання між цими довгими асиметричними вікнами і короткими вікнами ТШХ, показаними на фіг. 14 і 15.

Фіг. 16 являє собою блок-схему неогранічітельного прикладу пристрою 1600 для прямої компенсації накладення спектрів у часовій області у кодованому сигналі, прийнятому у растровому потоці 1601. З метою ілюстрації пристрій 1600 представлено з посиланням на корекцію FAC на фіг. 7 з використанням інформації з режиму ACELP. Фахівцям в даній області техніки повинно бути зрозуміло, що відповідний пристрій 1600 може бути реалізовано стосовно до всіх інших прикладів корекції FAC, представленим в цьому описі.

Пристрій 1600 містить приймач 1610 для прийому бітового потоку 1601, що представляє собою кодований сигнал, що включає в себе корекцію FAC.

Кадри ACELP з бітового потоку 1601 подаються в декодер 1611 ACELP, що включає в себе синтезує фільтр ACELP. Декодер 1611 ACELP формує відгук при відсутності вхідного сигналу (ZIR) 704 сінт�зованої сигнал 702 ACELP і ZIR 704 об'єднуються так, щоб утворити синтезований сигнал ACELP, за яким слід ZIR. Несвернутое вікно 502 FAC при цьому застосовується до об'єднаних сигналами 702 та 704, потім згортається і підсумовується в процесорі 1605, а потім застосовується до позитивного входу суматора 1620 для одержання першої (необов'язковою) частини звукового сигналу в кадрах ТШХ.

Параметри (prm) для кадрів ТШХ 20 з бітового потоку 1601 подаються на декодер 1606 ТШХ, після чого слід IMDCT-перетворення і вікно 1613 для IMDCT для формування синтезованого сигналу 1602 ТШХ 20, подається до позитивного входу суматора 1616 для отримання другої частини звукового сигналу в кадрах ТШХ 20.

Однак при переході між режимами кодування (наприклад, від кадру ACELP до кадру ТШХ 20) частину звукового сигналу не декодується належним чином без використання компенсатора 1615 FAC. У наведеному на фіг. 16 прикладі компенсатор 1615 FAC містить декодер 1617 FAC для декодування з прийнятого бітового потоку 1601 сигналу 504 корекції (фіг. 5), який відповідає сигналу 706 корекції (фіг. 7) після згортання, як на фіг. 5, і зворотного DCT (IDCT). Вихідний сигнал 1618 IDCT подається на позитивний вхід суматора 1620. Вихідний сигнал суматора 1620 подається на позитивний вхід суммато�ний сигнал для кадру ТШХ, наступного після кадру ACELP.

Фіг. 17 являє собою блок-схему неогранічітельного прикладу пристрою 1700 для прямої компенсації накладення спектрів у часовій області у кодованому сигнал для передачі на декодер. З метою ілюстрації пристрій 1700 представлено з посиланням на корекцію FAC на фіг. 7 з використанням інформації з способу ACELP. Фахівцям в даній області техніки повинно бути зрозуміло, що відповідний пристрій 1700 може бути реалізовано стосовно до всіх інших прикладів корекції FAC, представленим в цьому описі.

На пристрій 1700 подається підлягає кодуванню звуковий сигнал 1701. Логіка (не показана) подає ACELP-кадри звукового сигналу 1701 на ACELP-кодер 1710. Вихідний сигнал ACELP-кодера 1710 - кодовані за допомогою ACELP параметри 1702 - подається на перший вхід мультиплексора (MUX) 1711. Інший вихідний сигнал ACELP-кодера являє собою синтезований сигнал 1760, супроводжується відгуком при відсутності вхідного сигналу (ZIR) 1761 синтезує фільтра ACELP кодера 1710. Вікно 502 FAC застосовується до об'єднання сигналів 1760 і 1761. Вихідний сигнал процесора вікна 502 FAC подається на негативний вхід суматора 1751.

Логіка (не показана) також подає кадри ТШХ 20 звуковог�орой вхід мультиплексора 1711. Модуль 1712 кодування MDCT містить вікно 1731 MDCT, перетворення 1732 MDCT і кантователь 1733. Віконно зважений вхідний сигнал MDCT-модуля 1732 подається на позитивний вхід суматора 1750. Квантовані MDCT-коефіцієнти 1704 застосовуються до зворотного MDCT (IMDCT) 1733, а вихідний сигнал IMDCT 1733 подається на негативний вхід суматора 1750. Вихідний сигнал суматора 1750 утворює помилку квантування ТШХ, яка віконно зважується в процесорі 1736. Вихідний сигнал процесора 1736 подається на позитивний вхід суматора 1751. Як показано на фіг. 17, вихідний сигнал процесора 1736 може використовуватися в пристрої за необхідності.

При переході між режимами кодування (наприклад, від кадру ACELP до кадру ТШХ) деякі із звукових кадрів, кодованих MDCT-модулем 1712, можуть не декодуватися належним чином без додаткової інформації. Калькулятор 1713 видає цю додаткову інформацію, зокрема, сигнал 706 корекції (фіг. 7). Всі компоненти калькулятора 1713 можуть розглядатися як формувач сигналу корекції FAC. Формувач сигналу корекції FAC містить застосування вікна 502 FAC до звукового сигналу 1701, подачу вихідного сигналу вікна 502 FAC на позитивний вхід суматора 1751, подачу вихідного сигналу суматора подаються на вхід мультиплексора 1711.

Сигнал на виході мультиплексора 1711 являє собою закодований сигнал 1755, підлягає передачі на декодер (не показаний) через передавач 1756 у кодованому бітовому потоці 1757.

Фахівцям в даній області техніки повинно бути зрозуміло, що опис пристроїв і способів прямої компенсації накладення спектрів у часовій області у кодованому сигналі є всього лише ілюстративним і жодним чином не передбачає обмежень. Таким фахівці в даній області техніки без праці зможуть реалізувати інші варіанти здійснення, що мають переваги даного винаходу. Крім того, описані системи можуть бути змінені для реалізації корисних рішень з урахуванням наявних потреб і завдань компенсації накладення спектрів у часовій області у кодованому сигналі.

Фахівцям в даній області техніки має бути зрозуміло, що в численних типах кінцевих пристроїв і пристосувань можуть бути реалізовані як аспекти кодування для передачі кодованого звуку, так і аспекти декодування подальшого прийому кодованого звуку в одному і тому ж пристрої.

В інтересах ясності не всі із звичайних ознак реалізацій прямий компенсациипри розробці будь-якої такої фактичної реалізації кодування звукових сигналів повинні прийматися численні специфічні для реалізації рішення з метою досягнення конкретних завдань розробника, таких як відповідність обмежень, пов'язаних з додатками, системами, мережами і бізнесом, і що зазначені конкретні завдання будуть варіюватися від реалізації однієї до іншої і від одного розробника до іншого. Крім того, зрозуміло, що проектно-конструкторські роботи можуть виявитися складними і вимагають великих витрат часу, але, тим не менш, є стандартними завданнями проектування для фахівців в області систем кодування звукових сигналів, в яких реалізуються переваги даного винаходу.

Згідно з даними розкриттям, описані тут компоненти, етапи обробки і/або структури даних можуть бути реалізовані з використанням різних типів операційних систем, обчислювальних платформ, мережевих пристроїв, комп'ютерних програм та/або машин загального призначення. Крім того, фахівцям в даній області техніки повинно бути зрозуміло, що можуть також використовуватися пристрої менш загального призначення, такі як жорстко запрограмовані пристрої, що програмуються користувачем вентильні матриці (FPGA), спеціалізовані інтегральні схеми (ASIC) і т. п. У разі якщо спосіб, містить серію етапів обробки, реалізується за допомогою комп'ютера або вичислшиной, вони можуть зберігатися на матеріальному носії.

В описаних тут цілях описані системи та модулі можуть містити програмне забезпечення, мікропрограмне забезпечення, апаратне забезпечення або сукупність (сукупності) програмного забезпечення, пз або апаратного забезпечення. Програмне забезпечення та інші модулі можуть розташовуватися на серверах, робочих станціях, персональних комп'ютерах, комп'ютеризованих планшетах, кишенькових персональних комп'ютерів (PDA) та інших пристроях, що підходять для описаних тут цілей. Програмне забезпечення та інші модулі можуть бути доступні через локальне запам'ятовуючий пристрій, через мережу через браузер або інше додаток в контексті постачальника прикладних послуг (ASP) або через інші засоби, що підходять для описаних тут цілей. Описані структури даних можуть містити комп'ютерні файли, змінні, програмні масиви, програмні структури, або які-небудь схеми або способи зберігання електронної інформації, або їх сукупності, що підходять для описаних тут цілей.

Хоча даний винахід описано вище допомогою його неограничительних ілюстративних варіантів які� формули винаходу і в межах сутності цього винаходу.

1. Спосіб прямої компенсації накладення спектрів у часовій області у кодованому сигналі, прийнятому у растровому потоці в декодері, що містить етапи, на яких:
приймають у растровому потоці в декодері від кодера додаткову інформацію, що відноситься до корекції накладення спектрів у часовій області в кодованої сигналі, причому додаткова інформація являє собою сигнал корекції прямої компенсації накладення спектрів (FAC), що відноситься до різницевого сигналу, заснованому на різниці між сигналом, що підлягають кодуванню при переході від першого режиму кодування до другого режиму кодування, і синтезованим сигналом, отриманим з використанням першого режиму кодування;
компенсують накладення спектрів у часовій області у кодованому сигналі в декодері у відповідь на додаткову інформацію.

2. Спосіб за п. 1, що використовується при переходах між кадром з використанням прямокутного неперекривающегося вікна та кадром з використанням непрямоугольного перекривающегося вікна.

3. Спосіб за п. 1, в якому сигнал корекції FAC являє собою віконно зважений, або віконно зважений і згорнутий, сигнал корекції FAC.

4. Спосіб за п. 1, в якому з�кадру з використанням непрямоугольного перекривающегося вікна.

5. Спосіб за п. 1, в якому першим режимом кодування є режим Лінійного передбачення з кодовою збудженням (CELP), а другим режимом кодування є режим кодування з перетворенням.

6. Спосіб за п. 1, в якому різницевий сигнал заснований на різниці між підметом кодування сигналом і синтезованим сигналом, об'єднаним з відгуком при відсутності вхідного сигналу синтезує фільтра при першому режимі кодування.

7. Спосіб за п. 1, в якому компенсація накладення спектрів у часовій області містить етапи, на яких, в декодері:
декодують різницевий сигнал;
повторно обчислюють сигнал корекції FAC з використанням синтезованого сигналу і декодувати різницевого сигналу.

8. Спосіб за п. 1, в якому компенсація накладення спектрів у часовій області містить етапи, на яких, в декодері:
декодують сигнал корекції FAC;
підсумовують декодований сигнал корекції FAC з кодованим сигналом.

9. Спосіб за п. 1, в якому сигнал корекції FAC є квантованим з використанням факторів масштабування, використовуваних в непрямоугольних перекриваються вікнах.

10. Спосіб прямої компенсації накладення спектрів у тимчасовій окодере додаткову інформацію, відноситься до корекції накладення спектрів у часовій області у кодованому сигналі, причому обчислення додаткової інформації містить етап, на якому формують сигнал корекції прямої компенсації накладення спектрів (FAC), що відноситься до різницевого сигналу, заснованому на різниці між сигналом, що підлягають кодуванню при переході від першого режиму кодування до другого режиму кодування, і синтезованим сигналом, отриманим з використанням першого режиму кодування;
відправляють в растровому потік від кодера до декодера згадану додаткову інформацію, що відноситься до корекції накладення спектрів у часовій області у кодованому сигналі.

11. Спосіб за п. 10, використовується при переходах між кадром з використанням прямокутного неперекривающегося вікна та кадром з використанням непрямоугольного перекривающегося вікна.

12. Спосіб за п. 10, в якому обчислення додаткової інформації містить етап, на якому віконно зважують, або віконно зважують і згортають, сигнал корекції FAC.

13. Спосіб за п. 10, в якому обчислення додаткової інформації містить етап, на якому кодують з перетворенням сигнал корекції FAC з використанням convert�0, в якому першим режимом кодування є режим Лінійного передбачення з кодовою збудженням (CELP), а другим режимом кодування є режим кодування з перетворенням.

15. Спосіб за п. 10, в якому різницевий сигнал заснований на різниці між підметом кодування сигналом і синтезованим сигналом, об'єднаним з відгуком при відсутності вхідного сигналу синтезує фільтра при першому режимі кодування.

16. Спосіб за п. 10, що містить етап, на якому квантують їх сигнал корекції FAC з використанням факторів масштабування, використовуваних в непрямоугольних перекриваються вікнах.

17. Спосіб за п. 16, містить етап, на якому віднімають помилку квантування кодованого з перетворенням кадру з сигналу корекції FAC до квантування сигналу корекції FAC.

18. Пристрій для прямої компенсації накладення спектрів у часовій області у кодованому сигналі, прийнятому у растровому потоці, що містить:
приймач з бітового потоку від кодера додаткової інформації, що відноситься до корекції накладення спектрів у часовій області у кодованому сигналі, причому додаткова інформація містить сигнал корекції прямої компенсації накладення спектрів (FAC), відно�т першого режиму кодування до другого режиму кодування, і синтезованим сигналом, отриманим з використанням першого режиму кодування;
компенсатор накладення спектрів у часовій області у кодованому сигнал у відповідь на додаткову інформацію.

19. Пристрій п. 18, використовується при переходах між кадром з використанням прямокутного неперекривающегося вікна та кадром з використанням непрямоугольного перекривающегося вікна.

20. Пристрій п. 18, в якому сигнал корекції FAC являє собою віконно зважений, або віконно зважений і згорнутий, сигнал корекції FAC.

21. Пристрій п. 18, в якому сигнал корекції FAC є кодованим з перетворенням з використанням перетворення для кодування кадру з використанням непрямоугольного перекривающегося вікна.

22. Пристрій п. 18, в якому першим режимом кодування є режим Лінійного передбачення з кодовою збудженням (CELP), а другим режимом кодування є режим кодування з перетворенням.

23. Пристрій п. 18, в якому різницевий сигнал заснований на різниці між підметом кодування сигналом і синтезованим сигналом, об'єднаним з відгуком при відсутності вхідного сигналу синтезує фільтра при першому режі
повторно обчислює сигнал корекції FAC з використанням синтезованого сигналу і декодований різницевий сигнал.

25. Пристрій п. 18, в якому компенсатор в декодері:
декодує сигнал корекції FAC;
підсумовує декодований сигнал корекції FAC з кодованим сигналом.

26. Пристрій п. 18, в якому сигнал корекції FAC є квантованим з використанням факторів масштабування, використовуваних в непрямоугольних перекриваються вікнах.

27. Пристрій для прямої компенсації накладення спектрів у часовій області у кодованому сигнал для передачі в декодер, що містить:
обчислювач додаткової інформації, що відноситься до корекції накладення спектрів у часовій області у кодованому сигналі, причому обчислювач додаткової інформації містить формувач сигналу корекції прямої компенсації накладення спектрів (FAC), що відноситься до різницевого сигналу, заснованому на різниці між сигналом, що підлягають кодуванню при переході від першого режиму кодування до другого режиму кодування, і синтезованим сигналом, отриманим з використанням першого режиму кодування;
передавач для відправки в растровому потоці на декодер згадано� сигналі.

28. Пристрій п. 27, використовується при переходах між кадром з використанням прямокутного неперекривающегося вікна та кадром з використанням непрямоугольного перекривающегося вікна.

29. Пристрій п. 27, в якому формувач сигналу корекції FAC віконно зважує, або віконно зважує і згортає, сигнал корекції FAC.

30. Пристрій п. 27, в якому формувач сигналу корекції FAC кодує з перетворенням сигнал корекції FAC з використанням перетворення для кодування кадру з використанням непрямоугольного перекривающегося вікна.

31. Пристрій п. 27, в якому першим режимом кодування є режим Лінійного передбачення з кодовою збудженням (CELP), а другим режимом кодування є режим кодування з перетворенням.

32. Пристрій п. 27, в якому різницевий сигнал заснований на різниці між підметом кодування сигналом і синтезованим сигналом, об'єднаним з відгуком при відсутності вхідного сигналу синтезує фільтра при першому режимі кодування.

33. Пристрій п. 27, містить кантователь сигналу корекції FAC з використанням факторів масштабування, використовуваних в непрямоугольних перекриваються вікнах.<квантування сигналу корекції FAC.



 

Схожі патенти:

Заснована на фрагментах система і спосіб стиснення відео

Винахід відноситься до області систем обробки даних. Технічним результатом є скорочення часу очікування при виконанні відеоігор або додатків. Машинно-реалізований спосіб стиснення відео містить етап прийому запиту на сервері від клієнта на відтворення відеоігри або виконання програми по мережі Internet. У відповідь на даний запит встановлюють відеогру або сеанс програми з клієнтом. Згідно способу вимірюють характеристики каналу для каналу зв'язку мережі Internet між сервером і клієнтом. Далі здійснюють кодування згаданого виведення відео з використанням стиснення з малим часом очікування на сервері для формування відеопотоку з малим часом очікування. Висновок відео кодується зі швидкістю передачі бітів або з коефіцієнтом стиснення на основі виміряних характеристик каналу. Крім того, здійснюють потокову передачу відео з малим часом очікування з сервера на клієнт по мережі Internet, причому цей відеопотік з малим часом очікування декодується у клієнта. Всі операції, пов'язані з прийомом керуючих сигналів, переданих з клієнта, виконанням відеоігри або програми, кодуванням і потоковою передачею відеопотоку з малим часом очікування клієнт пЂеля виникає відчуття, що обрана гра або програма негайно реагують на керуючі сигнали, прийняті з клієнта. 2 н. і 39 з.п. ф-ли, 40 іл.

Пристрій для передачі інформації

Винахід відноситься до обчислювальної техніки і техніки зв'язку

Пристрій корекції подвійних помилок з використанням коду ріда-соломона

Винахід відноситься до обчислювальної техніки, а саме до пристроїв контролю запам'ятовуючих пристроїв, і може бути використано для підвищення достовірності інформації, збереженої в запам'ятовуючих пристроях

Пристрій для послідовного виявлення та виправлення помилок

Винахід відноситься до обчислювальної техніки і передачі даних, може бути використано для послідовного виявлення та виправлення помилок

Декодер кодів ріда-маллера порядку @

Винахід відноситься до техніки зв'язку і обчислювальної техніки

Пристрій для обчислення синдромів коду ріда-соломона

Винахід відноситься до обчислювальної техніки

Пристрій для контролю інформаційної послідовності імпульсів

Винахід відноситься до автоматики та обчислювальної техніки і може бути використане для контролю послідовності імпульсів у різних системах передачі даних

Пристрій і спосіб заснованого на геометрії просторового кодування звуку

Винахід відноситься до обробки звуку. Технічний результат - покращений захоплення просторового звуку. Надано пристрій для генерації, щонайменше, одного вихідного звукового сигналу на підставі потоку звукових даних, що включає в себе звукові дані, що відносяться до одного або більше джерел звуку. Пристрій включає в себе приймач для прийому потоку звукових даних, що включає в себе звукові дані. Звукові дані включають в себе одне або більше значень тиску для кожного з джерел звуку. Додатково звукові дані включають в себе одне або більше значень розташування, що вказують розташування одного з джерел звуку для кожного з джерел звуку. Крім того, пристрій включає в себе модуль синтезу для генерації, щонайменше, одного вихідного звукового сигналу на підставі, щонайменше, одного з одного або більше значень тиску звукових даних з потоку звукових даних і на підставі, щонайменше, одного з одного або більше значень розташування із звукових даних з потоку звукових даних. 9 н. і 16 з.п. ф-ли, 34 іл.

Пристрій і спосіб для розкладання вхідного сигналу з використанням понижуючого мікшера

Винахід відноситься до аудиообработке і, зокрема, до розкладання аудіосигналів на різні компоненти. Технічний результат - підвищення точності відтворення стереофонічного звуку. Для цього пристрій для розкладання вхідного сигналу, що має, щонайменше, три вхідних каналу, містить понижуючий мікшер для понижуючого мікшування вхідного сигналу, щоб отримувати мікшований з пониженням сигнал, який має меншу кількість каналів, аналізатор для аналізу мікшірованого з пониженням сигналу, щоб виводити результат аналізу, який направляється в процесор сигналів для обробки вхідного сигналу або сигналу, виведеного з вхідного сигналу, щоб отримувати розкладений сигнал. 3 н. і 12 н. п. ф-ли, 16 іл.

Канальне кодування на основі комплексного перетворення з частотним кодуванням з розширеною смугою

Винахід відноситься до засобів канального кодування на основі комплексного перетворення з частотним кодуванням з розширеною смугою. Технічний результат полягає в поліпшенні якості багатоканального звуку. Приймають закодовані дані багатоканального звуку в растровому потоці, причому закодовані дані багатоканального звуку містять дані кодування з канальним розширенням і дані кодування з частотним розширенням, причому дані кодування з канальним розширенням містять комбінований канал для безлічі звукових каналів і безліч параметрів для подання окремих каналів цього безлічі звукових каналів в якості модифікованих версій комбінованого каналу. Визначають на основі інформації в растровому потоці, містить згаданий безліч параметрів набір параметрів, що містить нормовану кореляційну матрицю, або набір параметрів, що містить комплексний параметр, що представляє відношення, що містить уявний компонент і дійсний компонент, для крос-кореляції між двома згаданого безлічі звукових каналів. На основі даного визначення декодують згадане безліч параметрів. Відновлюють м�з частотним розширенням. 4 н. і 16 з.п. ф-ли, 42 іл., 1 табл.

Стереофонічне кодування на основі mdct з комплексним пророкуванням

Винахід відноситься до засобів для стереофонічного кодування і декодування з використанням комплексного передбачення в частотній області. Технічний результат полягає в забезпеченні високої якості звуку при зменшенні обчислювальних витрат. В одному з варіантів здійснення винаходу спосіб декодування, призначений для отримання вихідного стереофонічного сигналу вхідного стереофонічного сигналу, закодованого за допомогою стереофонічного кодування з комплексним пророкуванням і включає перші уявлення двох вхідних каналів в частотній області, включає наступні етапи підвищує мікшування: обчислення другого подання першого вхідного каналу в частотній області і обчислення вихідного каналу на основі першого і другого уявлень першого вхідного каналу в частотній області, першого подання другого вхідного каналу в частотній області і коефіцієнта комплексного передбачення. Спосіб включає виконання модифікацій в частотній області селективно перед підвищує мікшуванням або після підвищує мікшування. 3 н. і 12 з.п. ф-ли, 19 іл.

Пристрій і спосіб для розкладання вхідного сигналу з використанням заздалегідь обчисленій еталонної кривої

Винахід відноситься до аудиообработке і, зокрема, до розкладання аудіосигналів на різні компоненти, наприклад, по-різному сприймані компоненти. Технічний результат - розкладання сигналу з використанням заздалегідь обчисленій частотно-залежної кривий подоби в якості еталонної кривої. Пристрій для розкладання сигналу, що має, щонайменше, три канали, містить аналізатор (16) для аналізу подібності між двома каналами аналізованого сигналу, пов'язаного з сигналом, що має, щонайменше, два аналізованих каналу, при цьому аналізатор виконаний з можливістю використання заздалегідь обчисленій частотно-залежної кривий подоби в якості еталонної кривої, щоб визначати результат аналізу. Процесор (20) сигналів обробляє аналізований сигнал або сигнал, який видобувають з аналізованого сигналу, або сигнал, з якого витягується аналізований сигнал, з використанням результату аналізу, щоб отримувати розкладений сигнал. 3 н. і 12 з.п. ф-ли, 16 іл.

Пристрій і спосіб для оцінки рівня кодованих аудіо кадрів в області бітового потоку

Винахід відноситься до засобів оцінки аудіо сигналу. Технічним результатом є підвищення ефективності кодування аудіо сигналу. Пристрій містить модуль визначення кодової книги з безлічі кодових книг як ідентифікованої кодової книги. У пристрої аудіо сигнал кодується, використовуючи визначений кодову книгу, і модуль оцінки, сконфігурований для отримання значення рівня, асоційованого з ідентифікованої кодовою книгою, в якості отриманого значення рівня та для оцінювання оцінки рівня аудіо сигналу, використовуючи отримане значення рівня. 8 н. і 11 з.п. ф-ли, 11 іл.

Пристрій для розширення смуги частот

Винахід відноситься до засобів для розширення смуги частот. Технічний результат полягає в поліпшенні сприйняття розширеного звукового сигналу. Генерують сигнал збудження на основі звукового сигналу, при цьому звуковий сигнал містить безліч частотних компонентів. Виділяють вектор ознак з звукового сигналу, при цьому вектор ознак містить щонайменше один ознака компонента в частотній області і щонайменше одна ознака компонента у часовій області. Визначають щонайменше один параметр форми спектра на основі вектора ознак, при цьому принаймні один параметр форми спектра відповідає сигналу піддіапазону, що містить частотні компоненти, які належать додаткового безлічі частотних компонентів. Генерують сигнал піддіапазони шляхом фільтрації сигналу збудження з допомогою банку фільтрів і зважування відфільтрованого сигналу збудження з використанням щонайменше одного параметра форми спектра. 3 н. і 18 з.п. ф-ли, 10 іл.

Способи і пристрої кодування і декодування об'єктно-орієнтованих аудіосигналів

Винахід відноситься до кодування і декодуванню аудіосигналу, в яких звукові образи для кожного об'єктного аудіосигналу можуть бути локалізовані в будь-якій позиції. Технічний результат - підвищення точності відтворення об'єктних аудіосигналів. Для цього в способі і пристрої кодування аудіосигналу і в способі і пристрої декодування аудіосигналу аудіосигнали можуть бути кодовані або декодованими так, що звукові образи можуть бути локалізовані в будь-якій позиції для кожного об'єктного аудіосигналу. Спосіб декодування аудіосигналу включає в себе витяг з аудіосигналу сигналу понижуючого мікшування і об'єктно-орієнтованої додаткової інформації; формування канально-орієнтованої додаткової інформації на основі об'єктно-орієнтованої додаткової інформації та керуючої інформації для відтворення сигналу понижуючого мікшування; обробку сигналу понижуючого мікшування з використанням декоррелированного канального сигналу; і формування багатоканального звуку з використанням обробленого сигналу понижуючого мікшування і канально-орієнтованої додаткової інформації. 3 �

Спосіб і пристрій для формування шумів

Винахід відноситься до галузі зв'язку

Спосіб та пристрій для управління згладжуванням стаціонарного фонового шуму

Винахід відноситься до кодування мовного сигналу в телекомунікаційних системах, зокрема, до способів і пристроїв для управління згладжуванням стаціонарного фонового шуму в таких системах
Up!