W listopadzie 2024 roku na rynku technologii wspierających zadebiutowało „InVision AI”, zaawansowane narzędzie do rozpoznawania obrazów, które dzięki sztucznej inteligencji (AI) potrafi identyfikować przedmioty, teksty, twarze i otoczenie w czasie rzeczywistym. Stworzone z myślą o osobach niewidomych i słabowidzących, „InVision AI” wykorzystuje kamerę smartfona lub dedykowanego urządzenia, aby zapewnić użytkownikom niezrównane wsparcie w codziennym życiu.
Najważniejsze funkcje „InVision AI”
1. Rozpoznawanie przedmiotów i otoczenia
Aplikacja potrafi identyfikować przedmioty codziennego użytku oraz elementy otoczenia, takie jak meble, pojazdy czy rośliny.
2. Odczytywanie tekstu w czasie rzeczywistym
„InVision AI” analizuje teksty drukowane i ręcznie pisane, pozwalając użytkownikom czytać książki, dokumenty i etykiety.
3. Identyfikacja twarzy
Narzędzie może zapamiętywać twarze i rozpoznawać je podczas interakcji społecznych, informując użytkownika, kto znajduje się w pobliżu.
4. Opis zdjęć i grafik
Aplikacja generuje szczegółowe opisy obrazów i zdjęć, co sprawia, że użytkownik zyskuje pełniejszy dostęp do treści wizualnych.
5. Wsparcie głosowe i personalizacja
Wszystkie funkcje są obsługiwane głosowo, a użytkownik może dostosować sposób działania aplikacji do swoich potrzeb.
6. Tryb offline
„InVision AI” działa również bez dostępu do internetu, oferując podstawowe funkcje nawet w trudnych warunkach.
Rozpoznawanie przedmiotów i otoczenia – widzenie przez dźwięk
„InVision AI” pozwala użytkownikom identyfikować przedmioty i elementy otoczenia w czasie rzeczywistym. Kamera rejestruje obraz, a sztuczna inteligencja:
• Informuje o przedmiotach w polu widzenia, np. „Filiżanka kawy na stole”.
• Rozpoznaje otoczenie, np. „Przed tobą znajduje się park z ławkami i drzewami”.
• Ostrzega o potencjalnych przeszkodach, takich jak schody czy słupy.
Przykład: Podczas spaceru aplikacja może powiedzieć: „Na twojej drodze jest niska przeszkoda, ominięcie możliwe w prawo”.
Odczytywanie tekstu w czasie rzeczywistym – niezależność w każdej sytuacji
„InVision AI” potrafi błyskawicznie odczytywać teksty drukowane i pisane ręcznie:
• Książki i dokumenty: Użytkownik może skanować strony tekstu, a aplikacja odczytuje je na głos.
• Etykiety i paragony: Narzędzie odczytuje informacje o produktach, np. daty ważności czy składniki.
• Znaki i tablice informacyjne: Aplikacja pomaga zrozumieć treści wizualne w miejscach publicznych, takich jak przystanki autobusowe czy sklepy.
Przykład: Użytkownik skanuje menu w restauracji, a aplikacja odczytuje jego zawartość, np. „Kategoria: Dania główne – makaron carbonara, cena 35 zł”.
Identyfikacja twarzy – nowe możliwości w relacjach społecznych
„InVision AI” umożliwia rozpoznawanie twarzy w czasie rzeczywistym:
• Zapamiętywanie osób: Użytkownik może dodać twarze znajomych i rodziny do bazy danych.
• Informacje w czasie rzeczywistym: Aplikacja informuje, kto znajduje się w polu widzenia, np. „To Jan Kowalski, Twój kolega z pracy”.
• Wsparcie w interakcjach społecznych: Narzędzie ułatwia identyfikację osób w grupach lub podczas spotkań.
Opis zdjęć i grafik – pełny dostęp do wizualnych treści
Dzięki AI, „InVision AI” generuje szczegółowe opisy zdjęć i obrazów:
• Fotografie: Aplikacja opisuje, co znajduje się na zdjęciu, np. „Zdjęcie przedstawia plażę z palmami i zachodzącym słońcem”.
• Grafiki i wykresy: Narzędzie konwertuje wizualne dane na opisy tekstowe, ułatwiając ich zrozumienie.
Przykład: Oglądając post na Instagramie, użytkownik może usłyszeć: „Zdjęcie przedstawia kota leżącego na sofie”.
Wsparcie głosowe i personalizacja – technologia na Twoich warunkach
„InVision AI” oferuje pełną obsługę głosową, co czyni ją intuicyjną i łatwą w użyciu. Funkcje personalizacji obejmują:
• Regulację prędkości i tonu głosu.
• Dostosowanie powiadomień: Użytkownik może określić, jakie informacje mają być przekazywane.
• Skróty głosowe: Przyspieszają dostęp do najczęściej używanych funkcji.
Tryb offline – zawsze dostępne wsparcie
„InVision AI” działa również bez połączenia z internetem:
• Rozpoznawanie przedmiotów: Aplikacja identyfikuje podstawowe obiekty i teksty w trybie offline.
• Zapisywanie treści: Możliwość zapisania odczytanych tekstów lub opisów do późniejszego wykorzystania.
Praktyczne zastosowania „InVision AI” w codziennym życiu
1. Zakupy
Rozpoznawanie etykiet produktów, dat ważności i cen ułatwia zakupy w sklepach.
2. Poruszanie się w przestrzeni publicznej
Informacje o otoczeniu, takie jak znaki drogowe, budynki czy przeszkody, zwiększają niezależność.
3. Relacje społeczne
Identyfikacja twarzy pomaga w interakcjach z rodziną, przyjaciółmi i współpracownikami.
4. Edukacja
Skanowanie podręczników, dokumentów i grafik wspiera naukę na różnych poziomach edukacji.
5. Praca zawodowa
„InVision AI” ułatwia odczytywanie dokumentów, analizę danych i organizację przestrzeni biurowej.
Podsumowanie – „InVision AI” jako krok milowy w technologii dostępności
„InVision AI” to narzędzie, które zmienia sposób, w jaki osoby niewidome i słabowidzące doświadczają otaczającego świata. Dzięki rozpoznawaniu przedmiotów, tekstów i twarzy, a także pełnemu wsparciu głosowemu, aplikacja zapewnia niezrównaną niezależność i wygodę.
Jeśli szukasz technologii, która pomoże Ci w codziennym życiu, „InVision AI” to rozwiązanie, które warto wypróbować.
- Czas dostępu: 03.12.2024, godz. 10:00 UTC, https://brytesoft.com/blog/accessibility-features-in-microsoft-office-2024.html
Kampania społeczna “Niewidomyprogramista.pl – daj szansę niepełnosprawnym programistom na start zawodowy” współfinansowana ze środków Narodowego Instytutu Wolności – Centrum Rozwoju Społeczeństwa Obywatelskiego w ramach Rządowego Programu Fundusz Inicjatyw Obywatelskich NOWEFIO na lata 2021–2030.