Возможно распознование распознавание речи в реальном времени на основе событий:
Преобразование речи в текст (speech to text) п.2
Постфактум распознование распознавание речи может выполняться запросом записи разговоров по фильтру start_datetime и end_datetime,
...