[go: up one dir, main page]

WO2025176402A1 - Method for adapting an infotainment system, infotainment system, and motor vehicle - Google Patents

Method for adapting an infotainment system, infotainment system, and motor vehicle

Info

Publication number
WO2025176402A1
WO2025176402A1 PCT/EP2025/051496 EP2025051496W WO2025176402A1 WO 2025176402 A1 WO2025176402 A1 WO 2025176402A1 EP 2025051496 W EP2025051496 W EP 2025051496W WO 2025176402 A1 WO2025176402 A1 WO 2025176402A1
Authority
WO
WIPO (PCT)
Prior art keywords
user
determined
infotainment system
question
time
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
PCT/EP2025/051496
Other languages
German (de)
French (fr)
Inventor
Doreen ENGELHARDT
Lena Rittger
Manya Sahakyan
Vanessa Hahn
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Audi AG
Original Assignee
Audi AG
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Audi AG filed Critical Audi AG
Publication of WO2025176402A1 publication Critical patent/WO2025176402A1/en
Pending legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60KARRANGEMENT OR MOUNTING OF PROPULSION UNITS OR OF TRANSMISSIONS IN VEHICLES; ARRANGEMENT OR MOUNTING OF PLURAL DIVERSE PRIME-MOVERS IN VEHICLES; AUXILIARY DRIVES FOR VEHICLES; INSTRUMENTATION OR DASHBOARDS FOR VEHICLES; ARRANGEMENTS IN CONNECTION WITH COOLING, AIR INTAKE, GAS EXHAUST OR FUEL SUPPLY OF PROPULSION UNITS IN VEHICLES
    • B60K35/00Instruments specially adapted for vehicles; Arrangement of instruments in or on vehicles
    • B60K35/10Input arrangements, i.e. from user to vehicle, associated with vehicle functions or specially adapted therefor
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60KARRANGEMENT OR MOUNTING OF PROPULSION UNITS OR OF TRANSMISSIONS IN VEHICLES; ARRANGEMENT OR MOUNTING OF PLURAL DIVERSE PRIME-MOVERS IN VEHICLES; AUXILIARY DRIVES FOR VEHICLES; INSTRUMENTATION OR DASHBOARDS FOR VEHICLES; ARRANGEMENTS IN CONNECTION WITH COOLING, AIR INTAKE, GAS EXHAUST OR FUEL SUPPLY OF PROPULSION UNITS IN VEHICLES
    • B60K35/00Instruments specially adapted for vehicles; Arrangement of instruments in or on vehicles
    • B60K35/20Output arrangements, i.e. from vehicle to user, associated with vehicle functions or specially adapted therefor
    • B60K35/26Output arrangements, i.e. from vehicle to user, associated with vehicle functions or specially adapted therefor using acoustic output
    • B60K35/265Voice
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W50/00Details of control systems for road vehicle drive control not related to the control of a particular sub-unit, e.g. process diagnostic or vehicle driver interfaces
    • B60W50/08Interaction between the driver and the control system
    • B60W50/14Means for informing the driver, warning the driver or prompting a driver intervention
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60KARRANGEMENT OR MOUNTING OF PROPULSION UNITS OR OF TRANSMISSIONS IN VEHICLES; ARRANGEMENT OR MOUNTING OF PLURAL DIVERSE PRIME-MOVERS IN VEHICLES; AUXILIARY DRIVES FOR VEHICLES; INSTRUMENTATION OR DASHBOARDS FOR VEHICLES; ARRANGEMENTS IN CONNECTION WITH COOLING, AIR INTAKE, GAS EXHAUST OR FUEL SUPPLY OF PROPULSION UNITS IN VEHICLES
    • B60K2360/00Indexing scheme associated with groups B60K35/00 or B60K37/00 relating to details of instruments or dashboards
    • B60K2360/146Instrument input by gesture
    • B60K2360/14643D-gesture
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60KARRANGEMENT OR MOUNTING OF PROPULSION UNITS OR OF TRANSMISSIONS IN VEHICLES; ARRANGEMENT OR MOUNTING OF PLURAL DIVERSE PRIME-MOVERS IN VEHICLES; AUXILIARY DRIVES FOR VEHICLES; INSTRUMENTATION OR DASHBOARDS FOR VEHICLES; ARRANGEMENTS IN CONNECTION WITH COOLING, AIR INTAKE, GAS EXHAUST OR FUEL SUPPLY OF PROPULSION UNITS IN VEHICLES
    • B60K2360/00Indexing scheme associated with groups B60K35/00 or B60K37/00 relating to details of instruments or dashboards
    • B60K2360/148Instrument input by voice
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60KARRANGEMENT OR MOUNTING OF PROPULSION UNITS OR OF TRANSMISSIONS IN VEHICLES; ARRANGEMENT OR MOUNTING OF PLURAL DIVERSE PRIME-MOVERS IN VEHICLES; AUXILIARY DRIVES FOR VEHICLES; INSTRUMENTATION OR DASHBOARDS FOR VEHICLES; ARRANGEMENTS IN CONNECTION WITH COOLING, AIR INTAKE, GAS EXHAUST OR FUEL SUPPLY OF PROPULSION UNITS IN VEHICLES
    • B60K2360/00Indexing scheme associated with groups B60K35/00 or B60K37/00 relating to details of instruments or dashboards
    • B60K2360/16Type of output information
    • B60K2360/164Infotainment
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60KARRANGEMENT OR MOUNTING OF PROPULSION UNITS OR OF TRANSMISSIONS IN VEHICLES; ARRANGEMENT OR MOUNTING OF PLURAL DIVERSE PRIME-MOVERS IN VEHICLES; AUXILIARY DRIVES FOR VEHICLES; INSTRUMENTATION OR DASHBOARDS FOR VEHICLES; ARRANGEMENTS IN CONNECTION WITH COOLING, AIR INTAKE, GAS EXHAUST OR FUEL SUPPLY OF PROPULSION UNITS IN VEHICLES
    • B60K2360/00Indexing scheme associated with groups B60K35/00 or B60K37/00 relating to details of instruments or dashboards
    • B60K2360/16Type of output information
    • B60K2360/167Vehicle dynamics information
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60KARRANGEMENT OR MOUNTING OF PROPULSION UNITS OR OF TRANSMISSIONS IN VEHICLES; ARRANGEMENT OR MOUNTING OF PLURAL DIVERSE PRIME-MOVERS IN VEHICLES; AUXILIARY DRIVES FOR VEHICLES; INSTRUMENTATION OR DASHBOARDS FOR VEHICLES; ARRANGEMENTS IN CONNECTION WITH COOLING, AIR INTAKE, GAS EXHAUST OR FUEL SUPPLY OF PROPULSION UNITS IN VEHICLES
    • B60K2360/00Indexing scheme associated with groups B60K35/00 or B60K37/00 relating to details of instruments or dashboards
    • B60K2360/16Type of output information
    • B60K2360/168Target or limit values
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60KARRANGEMENT OR MOUNTING OF PROPULSION UNITS OR OF TRANSMISSIONS IN VEHICLES; ARRANGEMENT OR MOUNTING OF PLURAL DIVERSE PRIME-MOVERS IN VEHICLES; AUXILIARY DRIVES FOR VEHICLES; INSTRUMENTATION OR DASHBOARDS FOR VEHICLES; ARRANGEMENTS IN CONNECTION WITH COOLING, AIR INTAKE, GAS EXHAUST OR FUEL SUPPLY OF PROPULSION UNITS IN VEHICLES
    • B60K2360/00Indexing scheme associated with groups B60K35/00 or B60K37/00 relating to details of instruments or dashboards
    • B60K2360/20Optical features of instruments
    • B60K2360/21Optical features of instruments using cameras
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60KARRANGEMENT OR MOUNTING OF PROPULSION UNITS OR OF TRANSMISSIONS IN VEHICLES; ARRANGEMENT OR MOUNTING OF PLURAL DIVERSE PRIME-MOVERS IN VEHICLES; AUXILIARY DRIVES FOR VEHICLES; INSTRUMENTATION OR DASHBOARDS FOR VEHICLES; ARRANGEMENTS IN CONNECTION WITH COOLING, AIR INTAKE, GAS EXHAUST OR FUEL SUPPLY OF PROPULSION UNITS IN VEHICLES
    • B60K2360/00Indexing scheme associated with groups B60K35/00 or B60K37/00 relating to details of instruments or dashboards
    • B60K2360/741Instruments adapted for user detection
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W2540/00Input parameters relating to occupants
    • B60W2540/22Psychological state; Stress level or workload
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W2556/00Input parameters relating to data
    • B60W2556/10Historical data

Definitions

  • the invention relates to a method for adapting an infotainment system (information entertainment system) included in a motor vehicle to user preferences.
  • a modern vehicle system such as a speech dialogue system in a motor vehicle, often depends on user-initiated inputs and is therefore static. If a dialogue initiated by the speech dialogue system, e.g., to determine user preferences, does not immediately lead to success, the user must repeatedly answer the same question or manually enter an input to answer this question.
  • US 2022/0 051 669 A1 discloses an interactive assistance device of a vehicle navigation system for a user with a proactive voice output function.
  • the voice output function asks the user situation-dependent questions based on previous recommendations and/or determined function usage behavior.
  • the invention is based on the object of proactively and situation-appropriately suggesting to a user functions of a vehicle system that are rarely or never used.
  • the invention provides a method for adapting an infotainment system included in a motor vehicle to user preferences.
  • the method comprises the following steps:
  • one or at least one contextual trigger is detected.
  • a trigger could, for example, be an environmental condition, such as an outside temperature below a predefined threshold or within a predefined value interval.
  • an outside temperature of -5 degrees Celsius to 15 degrees Celsius can be represented as a contextual trigger.
  • Another contextual trigger could be a specific day of the week and/or month and/or a time of year and/or a specific location and/or a network status, in particular a battery status of a device or system and/or a lighting condition and/or a specific weather condition, such as snowfall. If it is determined that it is currently snowing and/or the outside temperature is, for example, -5 degrees Celsius, then the vehicle heating, for example, to 20 degrees Celsius, is automatically activated or suggested via the infotainment system, to give one example.
  • the determination of such a contextual trigger can be realized with a sensor device, such as a temperature sensor and/or a snow depth sensor and/or a light sensor and/or a global navigation satellite system (GNSS), which can be taken from the state of the art.
  • a sensor device such as a temperature sensor and/or a snow depth sensor and/or a light sensor and/or a global navigation satellite system (GNSS), which can be taken from the state of the art.
  • GNSS global navigation satellite system
  • the Infotainment system may have a digital calendar system and/or a Real-Time Clock (RTC) module.
  • RTC Real-Time Clock
  • a hint can be a (proactive) question and/or a (proactive) suggestion from a voice dialogue system.
  • a point in time can be, for example, when the user is currently stuck in a traffic jam and/or the driving speed of their vehicle is within a predetermined range, such as 0 km/h to 30 km/h. At such a point in time or moment, the user's attention is therefore preferably not heavily demanded.
  • a speed sensor can be used for this purpose to signal such a point in time. Additionally or alternatively, such a point in time can be a subsequent one. If the interior noise of the vehicle is, for example, below a predetermined threshold, such as 10 to 65 decibels, this can be seen as a point in time at which the user is receptive to a hint.
  • the cue is formulated for the user.
  • the cue aims to determine the user's preferences. For example, the voice dialog system can issue a cue such as: "What is your preference for the seat massage?" or "Would you like to try the 'Wave' massage function?" The voice dialog system can thus use the cue to suggest activating a function that the user might want to use.
  • the speech dialogue system can therefore interpret a user's reaction, for example, by applying speech recognition.
  • an emotion recognition device can be included in the motor vehicle, which is configured to determine a user's reaction and/or forward it to the infotainment system.
  • the speech dialog system can then receive some kind of feedback from the user to obtain a rating for the function performed. If the user likes the function, they can communicate this manually or verbally to the speech dialog system, so that the resulting user preferences are saved.
  • These user preferences can consist of at least one of the following information: the contextual trigger and/or the time that caused the voice dialog system to introduce and present the function via a notification to the user and/or preferred day or time of day for using the function and/or frequency of requesting the function and/or duration of use of the function and/or feedback in the form of a star rating and/or a verbal comment made by the user after using the function and/or reaction time between the suggestion of the function by the voice dialog system and the confirmation or rejection by the user and/or emotion or mood captured from the user’s voice and/or cancellation or switching to another function during the use of the suggested function and/or an improvement suggested by the user.
  • mean B may mean: seat heating and/or an adaptive lighting system and/or a car radio and/or automatic climate control and/or the sunroof and/or a parking aid and/or an automatic start-stop system and/or a WLAN (Wireless Local Area Network) hotspot.
  • WLAN Wireless Local Area Network
  • a user profile containing these user preferences is then created for the user.
  • Infotainment system settings are derived or learned based on the user preferences. Alternatively, only one setting can be derived. For example, if the user preferences include the information that the user activates the seat heating when the outside temperature drops below 10 degrees Celsius, this function can be be started automatically when such an outside temperature is measured.
  • Settings of the infotainment system are therefore derived from the determined user preferences, in particular using the user profile, and these settings are applied.
  • the advantage of the invention is that the user's sense of comfort can be increased because settings can be automatically made based on their user preferences. Another advantage of the invention is that a user can become familiar with new and/or unused vehicle functions when they are clearly receptive to them. This can positively influence the user experience. Furthermore, the learning phase for creating the user profile can be shortened because the voice dialog system does not have to passively observe the user's behavior, but can actively ask about their preferences and save them as user preferences.
  • the invention also includes embodiments which provide additional advantages.
  • the notification refers to a function that the user has not yet activated at the time of receiving the notification and/or the user's frequency of use for this function falls below a predetermined threshold.
  • This threshold can, for example, be in a range from 1 to 10. This can be achieved, for example, using a profiling tool that is part of the infotainment system. This allows a user to become familiar with a function that is not yet used or is rarely used.
  • a further development provides for the frequency of use to be determined using a histone, whereby the histone quantifies which functions of the vehicle and/or how often these have been activated in the past while the user was registered as a passenger.
  • a state-of-the-art recognition device such as a facial recognition system and/or key recognition, can be used to identify the user as a passenger.
  • the histone is therefore a record or log of which functions of the vehicle were used by the user and how often.
  • the contextual trigger includes an estimated travel time and/or a planned destination and/or the current outside temperature and/or the user's usage profile.
  • information such as the estimated travel time
  • the estimated travel time can be read by a sensor, in particular by a global navigation satellite system. If the estimated travel time is, for example, more than ten minutes, the user can be asked, if there is also a time at which they are receptive to a notification, whether they would like to listen to a podcast, for example.
  • the speech dialogue system to have an artificial neural network trained using reinforcement learning on data sets (experience data sets) consisting of question-answer pairs to formulate instructions depending on at least one contextual trigger and/or a determined point in time.
  • artificial neural network refers to the software that enables the speech dialogue in the speech dialogue system.
  • steps b) to e) are skipped as soon as the artificial neural network signals that a predefined threshold for the contextual trigger has been reached. For example, if the neural network has learned a certainty or confidence of 80 to 90% in percentage points regarding a contextual trigger, steps b) to e) are skipped.
  • the neural network can have linked a confidence of 80% for a specific outside temperature, such as -5 to 5 degrees Celsius, as a contextual trigger, so that the user no longer needs to be asked whether the seat heating should be activated, as this now happens automatically. If the user then manually deactivates the seat heating, for example, this learned contextual trigger can be discarded, at least iteratively. This means that the confidence would be less than 80% the next time that contextual trigger occurs.
  • a further development provides that the following response is recorded: verbal and/or haptic feedback and/or a gesture, e.g., captured by a camera, such as a nod of the head, and/or a period of time that has passed, i.e., ignoring the hint. This period can be, for example, 10 to 30 seconds.
  • a change in user settings and/or an emotional reaction can be recorded as a response.
  • a change in user settings can, for example, be muting or reducing the volume, e.g., by 3 to 10 units or 10 to 20 decibels, of the infotainment system.
  • An emotional reaction can be recorded by a biometric sensor, such as a skin conductivity sensor and/or facial recognition software for identifying microexpressions and/or a thermal camera for measuring temperature changes in the face.
  • the invention also includes an infotainment system for a motor vehicle.
  • the infotainment system can have a data processing device or a processor device configured to carry out an embodiment of the method according to the invention.
  • the processor device can have at least one microprocessor and/or at least one microcontroller and/or at least one FPGA (Field Programmable Gate Array) and/or at least one DSP (Digital Signal Processor).
  • a CPU Central Processing Unit
  • a GPU Graphicical Processing Unit
  • NPU Neurological Processing Unit
  • the processor device can have program code configured to carry out the embodiment of the method according to the invention when executed by the processor device.
  • the program code can be stored in a data memory of the processor device.
  • the processor device can be based, for example, on at least one circuit board and/or on at least one SoC (System on Chip).
  • FIG. 1 shows a system for carrying out the method according to the invention
  • Fig. 2 shows a technical implementation for carrying out the method according to the invention
  • This content can then be fed to a decoder network 10.
  • the question answering model or the artificial neural network 13 is trained by means of reinforcement learning on data sets (experience data sets) consisting of question-answer pairs from a question corpus 5, to detect clues or formulate questions 11 depending on at least one contextual trigger 15 and/or a determined time 16.
  • a generated hint 11 can be sent to the geni:OS IQA Agent 1, which then reproduces it as a voice output.
  • the geni:OS IQA Agent 1 can therefore refer to a specific voice dialog system.
  • the result 19 is subjected to a completeness criterion, so that completeness or incompleteness is signaled.
  • This completeness criterion can, for example, be an achieved confidence, whereby this confidence can be calculated or read from the dialogue history 4. If this confidence is below a predetermined threshold value, the speech dialogue system 1 can be prompted to formulate a hint 11. For this purpose, for example, an existing question can be taken and/or asked from a question corpus 5 comprising question-answer pairs, so that a hint 11 is formulated. The aforementioned language style adaptation 9 can be carried out on this hint 11.
  • the result of this can be a reformulated question 24, after which a question-answer dialogue 25 can be conducted. This question-answer dialogue 25 can then be subjected to an evaluation 28.
  • a confirmation prompt 22 can be sent to the user 33.
  • a reaction 23 from the user 33 can then be determined or recorded.
  • an evaluation of the interaction 28 can be carried out. If this evaluation 28 contains a confidence below a threshold, the result is considered incomplete and such a signal is sent to a reformulation model 30 in order to create a reformulated question 31.
  • This reformulated question 31 can be, for example, an explanation, recommendation or follow-up question. Based on this reformulated question 31, a question-answer dialogue 25 can be carried out again, which is then subjected to another evaluation 28.
  • the question-and-answer dialogue 25 can be based on an NLU (Neural Language Understanding) corpus 26 and/or on emotion recognition 27 and/or on a dialogue history or interaction history 4. If the result is considered complete, the interaction can be learned or refined as an action, or even discarded, so that an adaptation of the AI interaction 29 is performed.
  • Fig. 3 shows the user 33 in a motor vehicle 32.
  • This motor vehicle 32 comprises an infotainment system 35 having a processor device 36.
  • the infotainment system 35 also includes the voice dialogue system 1.
  • the motor vehicle 32 has a temperature sensor 6. Symbolically represented is an outside temperature 37 of -5 degrees Celsius. This outside temperature 37 can be detected as a contextual trigger 15 via the temperature sensor 6 in the infotainment system 35.
  • a time 16 at which the user 33 is receptive to a hint 11 can be determined. If such a time 16 is determined, the hint 11 can be formulated to the user 33 based on the detected contextual trigger 15 and the determined time 16, wherein the hint 11 aims to determine user preferences of the user 33. This hint 11 is symbolically depicted as a question mark. Depending on the user's 33 reaction 23 to the notification 11, user preferences can be determined. A user profile can be created based on the user preferences. Settings 38 of the infotainment system 35 can then be derived and applied from the determined user preferences.

Landscapes

  • Engineering & Computer Science (AREA)
  • Transportation (AREA)
  • Mechanical Engineering (AREA)
  • Automation & Control Theory (AREA)
  • Chemical & Material Sciences (AREA)
  • Combustion & Propulsion (AREA)
  • Human Computer Interaction (AREA)
  • Navigation (AREA)

Abstract

The invention relates to a method for adapting an infotainment system (35) comprised in a motor vehicle (32) to user preferences. For this purpose, a contextual trigger (15) is detected and a time (16) at which a user (33) is receptive to a notification (11) is determined. Subsequently, the notification (11) is formulated to the user (33) on the basis of the detected contextual trigger (15) and the determined time (16), wherein the notification (11) aims to determine user preferences of the user (33). User preferences are then determined on the basis of the reaction (23) of the user (33) to the notification (11). A user profile is then created on the basis of the determined user preferences. Settings (38) of the infotainment system (35) are then derived from the determined user preferences and are applied.

Description

Verfahren zur Anpassung eines Infotainmentsystems sowie Infotainmentsystem und Kraftfahrzeug Method for adapting an infotainment system and infotainment system and motor vehicle

BESCHREIBUNG: DESCRIPTION:

Die Erfindung betrifft ein Verfahren zur Anpassung eines in einem Kraftfahrzeug umfassten Infotainmentsystems (Informations- Unterhaltungssystem) an Nutzerpräferenzen. The invention relates to a method for adapting an infotainment system (information entertainment system) included in a motor vehicle to user preferences.

Ein heutiges Fahrzeugsystem, wie z. B. ein Sprachdialogsystem in einem Kraftfahrzeug, ist oftmals abhängig von nutzerinitiierten Eingaben und ist damit statisch. Führt ein vom Sprachdialogsystem initiierter Dialog, z. B. zum Ermitteln von Nutzerpräferenzen, nicht direkt zum Erfolg, muss ein Nutzer wiederholt die gleiche Frage beantworten oder eine Eingabe zur Beantwortung dieser Frage manuell tätigen. A modern vehicle system, such as a speech dialogue system in a motor vehicle, often depends on user-initiated inputs and is therefore static. If a dialogue initiated by the speech dialogue system, e.g., to determine user preferences, does not immediately lead to success, the user must repeatedly answer the same question or manually enter an input to answer this question.

Die US 2021 / 0 326 344 A1 offenbart ein virtuelles Assistenzsystem für einen Nutzer mit einer Fahrzeug-Recheneinheit, die eine Funktion zur situationsbasierten Generierung audiovisueller Fragen aufweist. Die audiovisuellen Fragen werden gemäß einem gespeicherten Nutzerprofil und einer sensorisch ermittelten aktuellen Nutzersituation ausgegeben. US 2021/0 326 344 A1 discloses a virtual assistance system for a user with a vehicle computing unit that has a function for situation-based generation of audiovisual questions. The audiovisual questions are issued according to a stored user profile and a current user situation determined by sensors.

Die US 2022 / 0 051 669 A1 offenbart eine interaktive Assistenzvorrichtung eines Fahrzeug-Navigationssystems für einen Nutzer mit einer proaktiven Sprachausgabefunktion. Die Sprachausgabefunktion stellt zur Ergänzung eines Nutzerprofils situationsabhängig Fragen an den Nutzer, welche sich auf vorangegangene Empfehlungen und/oder ein ermitteltes Funktionsnutzungsverhalten beziehen. Der Erfindung liegt die Aufgabe zugrunde, einem Nutzer von ihm wenig oder gar nicht genutzte Funktionen eines Fahrzeugsystems proaktiv und situationsgemäß vorzuschlagen. US 2022/0 051 669 A1 discloses an interactive assistance device of a vehicle navigation system for a user with a proactive voice output function. To supplement a user profile, the voice output function asks the user situation-dependent questions based on previous recommendations and/or determined function usage behavior. The invention is based on the object of proactively and situation-appropriately suggesting to a user functions of a vehicle system that are rarely or never used.

Die Aufgabe wird durch die Gegenstände der unabhängigen Patentansprüche gelöst. The problem is solved by the subject matter of the independent patent claims.

Vorteilhafte Weiterbildungen der Erfindung sind durch die abhängigen Patentansprüche, die folgende Beschreibung sowie die Figuren beschrieben. Advantageous further developments of the invention are described by the dependent claims, the following description and the figures.

Durch die Erfindung ist ein Verfahren zur Anpassung eines in einem Kraftfahrzeug umfassten Infotainmentsystems an Nutzerpräferenzen bereitgestellt. Das Verfahren umfasst die folgenden Schritte: The invention provides a method for adapting an infotainment system included in a motor vehicle to user preferences. The method comprises the following steps:

Zuerst wird ein oder zumindest ein kontextueller Trigger erfasst, wobei ein solcher beispielsweise eine Umweltbedingung sein kann, wie etwa eine Außentemperatur unter einem vorgegebenen Schwellwert oder in einem vorgegebenen Werteintervall. Beispielsweise kann eine Außentemperatur von -5 Grad Celsius bis 15 Grad Celsius als kontextueller Trigger repräsentiert sein. Ein weiterer kontextueller Trigger könnte ein bestimmter Wochentag und/oder Monat und/oder eine Jahreszeit und/oder ein bestimmter Standort und/oder ein Netzwerkstatus, insbesondere ein Akkustatus eines Geräts oder Systems und/oder ein Lichtverhältnis und/oder eine bestimmte Wetterbedingung, wie z. B. Schneefall sein. Wird also ermittelt, dass es aktuell schneit und/oder die Außentemperatur z. B. -5 Grad Celsius beträgt, dann wird z. B über das Infotainmentsystem automatisch die Fahrzeugheizung, z. B. auf 20 Grad Celsius, aktiviert oder vorgeschlagen, um ein Beispiel zu nennen. First, one or at least one contextual trigger is detected. Such a trigger could, for example, be an environmental condition, such as an outside temperature below a predefined threshold or within a predefined value interval. For example, an outside temperature of -5 degrees Celsius to 15 degrees Celsius can be represented as a contextual trigger. Another contextual trigger could be a specific day of the week and/or month and/or a time of year and/or a specific location and/or a network status, in particular a battery status of a device or system and/or a lighting condition and/or a specific weather condition, such as snowfall. If it is determined that it is currently snowing and/or the outside temperature is, for example, -5 degrees Celsius, then the vehicle heating, for example, to 20 degrees Celsius, is automatically activated or suggested via the infotainment system, to give one example.

Das Ermitteln eines solchen kontextuellen Triggers lässt sich mit einer Sensorvorrichtung, wie z. B. einem Temperatursensor und/oder einem Schneetiefensensor und/oder einem Lichtsensor und/oder einem globalem Navigationssatellitensystem (GNSS) realisieren, der dem Stand der Technik entnommen werden kann. Um z. B. zeitliche Größen, wie etwa Uhrzeit und/oder Wochentag und/oder Monat zu ermitteln, kann das Infotainmentsystem ein digitales Kalendersystem und/oder ein Real-Time Clock (RTC) Modul aufweisen. The determination of such a contextual trigger can be realized with a sensor device, such as a temperature sensor and/or a snow depth sensor and/or a light sensor and/or a global navigation satellite system (GNSS), which can be taken from the state of the art. For example, to determine temporal variables such as time and/or day of the week and/or month, the Infotainment system may have a digital calendar system and/or a Real-Time Clock (RTC) module.

Als nächstes wird ein Zeitpunkt ermittelt, zu dem ein Nutzer für einen Hinweis empfänglich ist. Ein Hinweis kann eine (proaktive) Frage und/oder ein (proaktiver) Vorschlag eines Sprachdialogsystems sein. Solch ein Zeitpunkt kann beispielsweise dann sein, wenn der Nutzer aktuell im Stau steht und/oder die Fahrgeschwindigkeit seines Kraftfahrzeugs in einem vorgegebenen Bereich, wie z. B. 0 km/h bis 30 km/h liegt. In einem solchen Zeitpunkt oder Moment ist die Aufmerksamkeit des Nutzers also vorzugsweise nicht stark beansprucht. Hierzu kann ein Geschwindigkeitssensor verwendet werden, um einen solchen Zeitpunkt zu signalisieren. Zusätzlich oder alternativ kann solch ein Zeitpunkt ein folgender sein. Beträgt die Innenraum lautstärke des Kraftfahrzeugs z. B. eine Lautstärke unter einem vorgegebenen Schwellwert, wie z. B. 10 bis 65 Dezibel, kann das als ein Zeitpunkt gesehen werden, zu dem der Nutzer empfänglich für einen Hinweis ist. Next, a point in time is determined at which a user is receptive to a hint. A hint can be a (proactive) question and/or a (proactive) suggestion from a voice dialogue system. Such a point in time can be, for example, when the user is currently stuck in a traffic jam and/or the driving speed of their vehicle is within a predetermined range, such as 0 km/h to 30 km/h. At such a point in time or moment, the user's attention is therefore preferably not heavily demanded. A speed sensor can be used for this purpose to signal such a point in time. Additionally or alternatively, such a point in time can be a subsequent one. If the interior noise of the vehicle is, for example, below a predetermined threshold, such as 10 to 65 decibels, this can be seen as a point in time at which the user is receptive to a hint.

Anschließend, wenn also zumindest ein kontextueller Hinweis und ein Zeitpunkt, zu dem der Nutzer für einen Hinweis empfänglich ist, ermittelt wurde, wird der Hinweis an den Nutzer formuliert. Der Hinweis zielt darauf ab, Nutzerpräferenzen des Nutzers zu ermitteln. Beispielsweise kann das Sprachdialogsystem als Hinweis ausgeben: „Was ist deine Präferenz für die Sitzmassage?“ oder „Willst du mal die Massagefunktion „Welle“ ausprobieren?“. Das Sprachdialogsystem kann also über den Hinweis einen Vorschlag zum Aktivieren einer Funktion abgegeben, die der Nutzer möglicherweise nutzen möchte. Subsequently, once at least one contextual cue and a time at which the user is receptive to a cue have been identified, the cue is formulated for the user. The cue aims to determine the user's preferences. For example, the voice dialog system can issue a cue such as: "What is your preference for the seat massage?" or "Would you like to try the 'Wave' massage function?" The voice dialog system can thus use the cue to suggest activating a function that the user might want to use.

In Abhängigkeit von der Reaktion des Nutzers auf den Hinweis werden dann Nutzerpräferenzen ermittelt. Das Sprachdialogsystem kann also durch z. B. Anwenden einer Spracherkennung eine Reaktion des Nutzers interpretieren. Zusätzlich oder alternativ kann eine Emotionserkennungsvorrichtung im Kraftfahrzeug umfasst sein, die dazu eingerichtet ist eine Reaktion des Nutzers zu ermitteln und/oder an das Infotainmentsystem weiterzuleiten. Wenn also der Nutzer über das Sprachdialogsystem eine vorgeschlagene Funktion des Sprachdialogsystems, wie die oben genannte Massagefunktion, anfordert, initiiert das Sprachdialogsystem die Ausführung dieser Funktion. Im Anschluss kann das Sprachdialogsystem eine Art Feedback vom Nutzer bekommen, um eine Bewertung für die ausgeführte Funktion zu erhalten. Hat dem Nutzer also die Funktion gefallen, kann er dies manuell oder sprachlich an das Sprachdialogsystem übermitteln, sodass daraus resultierend Nutzerpräferenzen abgespeichert werden. Depending on the user's reaction to the hint, user preferences are then determined. The speech dialogue system can therefore interpret a user's reaction, for example, by applying speech recognition. Additionally or alternatively, an emotion recognition device can be included in the motor vehicle, which is configured to determine a user's reaction and/or forward it to the infotainment system. Thus, if the user suggests a If a user requests a function of the speech dialog system, such as the massage function mentioned above, the speech dialog system initiates the execution of this function. The speech dialog system can then receive some kind of feedback from the user to obtain a rating for the function performed. If the user likes the function, they can communicate this manually or verbally to the speech dialog system, so that the resulting user preferences are saved.

Diese Nutzerpräferenzen können aus zumindest einer der folgenden Informationen bestehen: dem kontextuellen Trigger und/oder dem Zeitpunkt, der das Sprachdialogsystem dazu veranlasst hat, die Funktion über einen Hinweis an den Nutzer vorzustellen und zu präsentieren, und/oder bevorzugte Tages- oder Uhrzeit für die Nutzung der Funktion und/oder Häufigkeit der Anforderung der Funktion und/oder Dauer der Nutzung der Funktion und/oder Feedback in Form von einer Sternbewertung und/oder ein sprachlicher Kommentar, den der Nutzer nach der Nutzung der Funktion abgibt, und/oder Reaktionszeit zwischen dem Vorschlag der Funktion durch das Sprachdialogsystem und der Bestätigung oder Ablehnung durch den Nutzer und/oder Emotion oder Stimmung, die aus der Stimme des Nutzers erfasst wird und/oder Abbruch oder Wechsel zu einer anderen Funktion während der Nutzung der vorgeschlagenen Funktion und/oder eine vom Nutzer vorgeschlagene Verbesserung. Mit Funktion kann z. B gemeint sein: eine Sitzheizung und/oder ein adaptives Lichtsystem und/oder ein Autoradio und/oder eine Klimaautomatik und/oder das Schiebedach und/oder eine Einparkhilfe und/oder eine Start-Stopp-Automatik und/oder ein WLAN (Wireless Local Area Network)-Hotspot. These user preferences can consist of at least one of the following information: the contextual trigger and/or the time that caused the voice dialog system to introduce and present the function via a notification to the user and/or preferred day or time of day for using the function and/or frequency of requesting the function and/or duration of use of the function and/or feedback in the form of a star rating and/or a verbal comment made by the user after using the function and/or reaction time between the suggestion of the function by the voice dialog system and the confirmation or rejection by the user and/or emotion or mood captured from the user’s voice and/or cancellation or switching to another function during the use of the suggested function and/or an improvement suggested by the user. Function can, for example, mean B may mean: seat heating and/or an adaptive lighting system and/or a car radio and/or automatic climate control and/or the sunroof and/or a parking aid and/or an automatic start-stop system and/or a WLAN (Wireless Local Area Network) hotspot.

Ein Nutzerprofil, aufweisend diese Nutzerpräferenzen, wird dann für den Nutzer erstellt. Anhand der Nutzerpräferenzen werden Einstellungen des Infotainmentsystems abgeleitet oder erlernt. Es kann alternativ vorgesehen sein, dass nur eine Einstellung abgeleitet wird. Beinhalten beispielsweise die Nutzerpräferenzen die Information, dass der Nutzer ab einer Außentemperatur von unter 10 Grad Celsius die Sitzheizung aktiviert, so kann diese Funktion automatisch gestartet werden, wenn eine solche Außentemperatur gemessen wird. A user profile containing these user preferences is then created for the user. Infotainment system settings are derived or learned based on the user preferences. Alternatively, only one setting can be derived. For example, if the user preferences include the information that the user activates the seat heating when the outside temperature drops below 10 degrees Celsius, this function can be be started automatically when such an outside temperature is measured.

Es erfolgt also ein Ableiten von Einstellungen des Infotainmentsystems aus den ermittelten Nutzerpräferenzen, insbesondere unter Nutzung des Nutzerprofils, und ein Anwenden dieser Einstellungen. Settings of the infotainment system are therefore derived from the determined user preferences, in particular using the user profile, and these settings are applied.

Vorteil der Erfindung ist, dass ein Komfortgefühl für den Nutzer dadurch erhöht werden kann, da anhand seiner Nutzerpräferenzen automatisch Einstellungen vorgenommen werden können. Unter anderem ist ein weiterer Vorteil der Erfindung, dass ein Nutzer neue und/oder ungenutzte Fahrzeugfunktionen dann kennenlernen kann, wenn er für solche offensichtlich empfänglich ist. Dies kann die Benutzererfahrung für diesen Nutzer positiv beeinflussen. Zudem kann die Lernphase zum Erstellen des Nutzerprofils verkürzt werden, da das Sprachdialogsystem nicht passiv das Nutzerverhalten des Nutzers beobachten muss, sondern aktiv nach seinen Präferenzen fragen und diese als Nutzerpräferenzen speichern kann. The advantage of the invention is that the user's sense of comfort can be increased because settings can be automatically made based on their user preferences. Another advantage of the invention is that a user can become familiar with new and/or unused vehicle functions when they are clearly receptive to them. This can positively influence the user experience. Furthermore, the learning phase for creating the user profile can be shortened because the voice dialog system does not have to passively observe the user's behavior, but can actively ask about their preferences and save them as user preferences.

Zu der Erfindung gehören auch Ausführungsformen, durch die sich zusätzliche Vorteile ergeben. The invention also includes embodiments which provide additional advantages.

Eine Weiterbildung sieht vor, dass der Hinweis auf eine Funktion abzielt, die der Nutzer bis zum Zeitpunkt des Erhalts des Hinweises noch nicht aktiviert hat und/oder die Nutzungshäufigkeit des Nutzers für diese Funktion einen vorbestimmten Schwellenwert unterschreitet. Dieser Schwellenwert kann beispielsweise in einem Bereich von 1 bis 10 liegen. Dies kann beispielsweise durch ein Profiling-Tool realisiert werden, dass Teil des Infotainmentsystem ist. Ein Nutzer kann dadurch eine noch nicht oder selten genutzte Funktion kennenlernen. A further development provides that the notification refers to a function that the user has not yet activated at the time of receiving the notification and/or the user's frequency of use for this function falls below a predetermined threshold. This threshold can, for example, be in a range from 1 to 10. This can be achieved, for example, using a profiling tool that is part of the infotainment system. This allows a user to become familiar with a function that is not yet used or is rarely used.

Eine Weiterbildung sieht vor, dass die Nutzungshäufigkeit mittels einer Histone ermittelt wird, wobei die Histone quantifiziert, welche Funktionen des Kraftfahrzeugs und/oder wie oft diese bereits in der Vergangenheit aktiviert wurden, während der Nutzer als Insasse registriert war. Zur Registrierung des Nutzers als Insassen kann eine Erkennungsvorrichtung aus dem Stand der Technik, wie etwa ein Gesichtserkennungssystem und/oder eine Schlüsselerkennung, verwendet werden. Es handelt sich bei der Histone also um eine Aufzeichnung oder ein Protokoll darüber, welche Funktionen des Kraftfahrzeugs vom Nutzer verwendet wurden und wie oft. A further development provides for the frequency of use to be determined using a histone, whereby the histone quantifies which functions of the vehicle and/or how often these have been activated in the past while the user was registered as a passenger. A state-of-the-art recognition device, such as a facial recognition system and/or key recognition, can be used to identify the user as a passenger. The histone is therefore a record or log of which functions of the vehicle were used by the user and how often.

Eine Weiterbildung sieht vor, dass in Schritt a) der kontextuelle Trigger eine voraussichtliche Fahrdauer und/oder ein geplantes Fahrziel und/oder die aktuelle Außentemperatur und/oder das Nutzungsprofil des Nutzers umfasst. Wie bereits beschrieben kann so eine Information, wie etwa die voraussichtliche Fahrdauer, durch einen Sensor, hierbei insbesondere durch ein Globales Navigationssatellitensystem ausgelesen werden. Beträgt die voraussichtliche Fahrdauer z. B. mehr als zehn Minuten, kann der Nutzer, falls ebenfalls ein Zeitpunkt vorliegt, zu dem er empfänglich für einen Hinweis ist, gefragt werden, ob er z. B. einen Podcast hören möchte. A further development provides that in step a), the contextual trigger includes an estimated travel time and/or a planned destination and/or the current outside temperature and/or the user's usage profile. As already described, such information, such as the estimated travel time, can be read by a sensor, in particular by a global navigation satellite system. If the estimated travel time is, for example, more than ten minutes, the user can be asked, if there is also a time at which they are receptive to a notification, whether they would like to listen to a podcast, for example.

Eine Weiterbildung sieht vor, dass in Schritt b) das Ermitteln eines Zeitpunkts in Abhängigkeit von einer Fahrgeschwindigkeit und/oder einer Innenraum lautstärke des Kraftfahrzeugs und/oder einer ermittelten Anzahl von Insassen im Kraftfahrzeug und/oder einer umgebenden Verkehrsdichte erfolgt. Wird von dem Infotainmentsystem z. B. über einen Umgebungssensor, insbesondere über einen Ultraschallsensor und/oder Radarsensor erkannt, dass sich der Nutzer im Stau befindet, so kann das Sprachdialogsystem dazu veranlasst werden einen Hinweis an den Nutzer zu formulieren. Hierdurch ergibt sich der Vorteil, dass dem Nutzer ein Hinweis lediglich in zumindest gering ablenkenden Situationen übermittelt wird. A further development provides that, in step b), a time is determined depending on a driving speed and/or the interior noise of the motor vehicle and/or a determined number of occupants in the motor vehicle and/or the surrounding traffic density. If the infotainment system detects, for example, via an environmental sensor, in particular via an ultrasonic sensor and/or radar sensor, that the user is in a traffic jam, the voice dialogue system can be prompted to formulate a notification to the user. This has the advantage that the user is only provided with a notification in at least slightly distracting situations.

Eine Weiterbildung sieht vor, dass Schritt c) auf einem „Active Question Answering“-Sprachdialog basiert, wobei dieser von einem Sprachdialogsystem initiiert und mit dem Nutzer durchgeführt wird. Das Sprachdialogsystem ist dazu ausgebildet eine gesprochene und/oder textbasierte und/oder menübasierte Rückmeldung des Nutzers zu empfangen. Zur Implementierung des Sprachdialogs kann sich der Fachmann an der Publikation von Buck, Christian et al. “Ask the Right Questions: Active Question Reformulation with Reinforcement Learning.” orientieren. A further development provides that step c) is based on an "Active Question Answering" voice dialogue, which is initiated by a voice dialogue system and carried out with the user. The voice dialogue system is designed to receive spoken and/or text-based and/or menu-based feedback from the user. To implement the voice dialogue, the expert can refer to the Publication by Buck, Christian et al. “Ask the Right Questions: Active Question Reformulation with Reinforcement Learning.” orientate.

Hierzu sieht eine Weiterbildung vor, dass das Sprachdialogsystem ein künstliches neuronales Netzwerk aufweist, und mittels Reinforcement Learning auf Datensätzen (Erfahrungsdatensätzen), bestehend aus Frage- Antwort-Paaren, darauf trainiert ist, Hinweise in Abhängigkeit von zumindest einem kontextuellen Trigger und/oder eines ermittelten Zeitpunkts zu formulieren. Mit künstlichem neuronalen Netzwerk ist hier die insgesamt den Sprachdialog in dem Sprachdialogsystem ermöglichende Software gemeint. For this purpose, a further development provides for the speech dialogue system to have an artificial neural network trained using reinforcement learning on data sets (experience data sets) consisting of question-answer pairs to formulate instructions depending on at least one contextual trigger and/or a determined point in time. The term "artificial neural network" refers to the software that enables the speech dialogue in the speech dialogue system.

Eine Weiterbildung sieht vor, dass die Schritte b) bis e) übersprungen werden, sobald das künstliche neuronale Netzwerk signalisiert, dass ein vorgegebener Schwellenwert für den kontextuellen Trigger erreicht ist. Hat das neuronale Netzwerk also beispielsweise eine Sicherheit oder Konfidenz von 80 bis 90 % in Prozentpunkten bezüglich einem kontextuellen Trigger erlernt, so werden die Schritte b) bis e) übersprungen. Beispielsweise kann das neuronale Netzwerk eine Konfidenz von 80% für eine bestimmte Außentemperatur, wie etwa -5 bis 5 Grad Celsius, als kontextuellen Trigger verknüpft haben, sodass der Nutzer hierbei nicht mehr gefragt werden muss, ob die Sitzheizung aktiviert werden soll, sodass dies nun automatisch geschieht. Sollte der Nutzer dann z. B. die Sitzheizung manuell deaktivieren, so kann dieser gelernte kontextuelle Trigger zumindest iterativ verworfen werden. Das heißt die Konfidenz wäre beim nächsten Auftreten desjenigen kontextuellen Triggers geringer als 80%. A further development provides that steps b) to e) are skipped as soon as the artificial neural network signals that a predefined threshold for the contextual trigger has been reached. For example, if the neural network has learned a certainty or confidence of 80 to 90% in percentage points regarding a contextual trigger, steps b) to e) are skipped. For example, the neural network can have linked a confidence of 80% for a specific outside temperature, such as -5 to 5 degrees Celsius, as a contextual trigger, so that the user no longer needs to be asked whether the seat heating should be activated, as this now happens automatically. If the user then manually deactivates the seat heating, for example, this learned contextual trigger can be discarded, at least iteratively. This means that the confidence would be less than 80% the next time that contextual trigger occurs.

Eine Weiterbildung sieht vor, dass Schritt c) beinhaltet, dass die Frage umformuliert wird, falls keine Nutzerpräferenzen ermittelt werden konnten und/oder falls eine Ratlosigkeitsgeste des Nutzers ermittelt wird. Das Umformulieren umfasst, dass eine Frage gestellt wird, die direkt nach der initial formulierten Frage gemäß einer geordneten Wahrscheinlichkeitsliste basierend auf Ergebnissen des Sprachdialogs positioniert ist. Die Neufassung der Frage basiert also auf einer geordneten Liste von Wahrscheinlichkeiten, die sich aus den Ergebnissen des vorangegangenen Sprachdialogs ableitet, wobei die neue Frage unmittelbar nach der ursprünglich gestellten Frage angeordnet ist. Dadurch kann sichergestellt werden, dass Missverständnisse reduziert werden und/oder zuverlässig Nutzerpräferenzen ermittelt werden. A further development provides that step c) involves reformulating the question if no user preferences could be determined and/or if a user gesture of confusion is detected. Reformulating involves asking a question that is positioned directly after the initially formulated question according to an ordered probabilities list based on the results of the speech dialogue. The reformulation of the question is therefore based on an ordered list of probabilities derived from the results of the previous speech dialogue. The new question is placed immediately after the original question. This can ensure that misunderstandings are reduced and/or user preferences are reliably determined.

Eine Weiterbildung sieht vor, dass die Ratlosigkeitsgeste umfasst, dass durch eine bildbasierte und/oder radarbasierte und/oder lidarbasierte und/oder mikrofonbasierte Nutzerüberwachung erkannt wird, dass der Nutzer als Reaktion auf ein von dem Infotainmentsystem ausgegebenen Hinweis hin, mit den Schulter zuckt und/oder die Stirn runzelt und/oder stöhnt und/oder eine vorbestimmte Geste zur Anforderung von Hilfe ausführt. A further development provides that the helplessness gesture comprises detecting, by means of image-based and/or radar-based and/or lidar-based and/or microphone-based user monitoring, that the user shrugs his shoulders and/or frowns and/or groans and/or performs a predetermined gesture to request help in response to a notification issued by the infotainment system.

Eine Weiterbildung sieht vor, dass als Reaktion: eine verbale und/oder haptische Rückmeldung und/oder eine Geste, die z. B. von einer Kamera erfasst wird, wie z.B. ein Kopfnicken und/oder eine vergangene Zeitdauer, also ein Ignorieren des Hinweises, erfasst wird. Diese Zeitdauer kann beispielsweise 10 bis 30 Sekunden betragen. Zusätzlich oder alternativ kann als Reaktion eine Änderung in den Benutzereinstellungen und/oder eine emotionale Reaktion erfasst werden. Eine Änderung in den Benutzereinstellungen kann z. B. ein Stummschalten oder ein Reduzieren der Lautstärke, z. B. um 3 bis 10 Einheiten oder 10 bis 20 Dezibel, des Infotainmentsystems sein. Eine emotionale Reaktion kann durch einen biometrischen Sensor, wie z.B. einen Hautleitfähigkeitssensor und/oder einer Gesichtserkennungssoftware zur Identifizierung von Mikroexpressionen und/oder einer Thermalkamera zur Messung von Temperaturveränderungen im Gesicht, erfasst werden. A further development provides that the following response is recorded: verbal and/or haptic feedback and/or a gesture, e.g., captured by a camera, such as a nod of the head, and/or a period of time that has passed, i.e., ignoring the hint. This period can be, for example, 10 to 30 seconds. Additionally or alternatively, a change in user settings and/or an emotional reaction can be recorded as a response. A change in user settings can, for example, be muting or reducing the volume, e.g., by 3 to 10 units or 10 to 20 decibels, of the infotainment system. An emotional reaction can be recorded by a biometric sensor, such as a skin conductivity sensor and/or facial recognition software for identifying microexpressions and/or a thermal camera for measuring temperature changes in the face.

Zusätzlich oder alternativ kann die Stimmlage z. B. über ein Mikrofon derart erfasst werden, dass Frequenzänderungen der Stimme an Wortenden (z.B. die Unterscheidung „ansteigend“, „abfallen“, „gleichbleibend“) als Eingabedaten in das Neuronale Netzwerk eingegeben werden. Die Kombination aus Mimik und Stimmlage ergeben den besonderen Vorteil, dass audiovisuelle Signale erfasst werden, um eine emotionale Reaktion des Nutzers zu deuten. Eine Weiterbildung sieht vor, dass ein Aktivieren oder Deaktivieren zum Ableiten von zumindest einer Einstellung in Abhängigkeit von einer manuellen Eingabe oder Rückmeldung angesteuert wird. Mit anderen Worten kann der Nutzer gezielt einen Lernprozess des Infotainmentsystems ansteuern oder ausschalten. Veranlasst also der Nutzer den Start eines solchen Lernprozesses kann vorgesehen sein, dass Nutzerpräferenzen in Abhängigkeit von einem bereits erfassten oder zu erfassenden kontextuellen Trigger ermittelt werden. Das Aktivieren dieses Lernprozesses kann z. B. derart eingestellt werden, dass das Infotainmentsystem Nutzerpräferenzen für die nächste halbe Stunde oder für die nächsten zwei Stunden oder (vorerst) ohne zeitliche Begrenzung erfassen soll. Ebenso kann vorgesehen sein, dass für die nächste halbe Stunde oder für die nächsten zwei Stunden oder (vorerst) ohne zeitliche Begrenzung keine Nutzerpräferenzen ermittelt werden sollen. Dadurch hat der Nutzer also die Kontrolle darüber, wann Nutzerpräferenzen erfassten werden sollen. Des Weiteren können Bedenken bezüglich Datenschutz gemindert werden. Während einer Fahrt mit mehreren Insassen können z. B. unterschiedliche Musikstile gespielt werden. Um zu verhindern, dass dem Nutzer fremde Musikpräferenzen als Nutzerpräferenzen zugewiesen werden, ist es also sinnvoll den Lernprozess manuell deaktivieren zu können. Additionally or alternatively, the voice pitch can be captured, for example, via a microphone in such a way that frequency changes of the voice at the end of words (e.g., the distinction between "rising,""falling,""constant") are fed into the neural network as input data. The combination of facial expressions and voice pitch provides the particular advantage of capturing audiovisual signals to interpret the user's emotional reaction. A further development provides that activation or deactivation for deriving at least one setting is controlled depending on a manual input or feedback. In other words, the user can specifically control or deactivate a learning process of the infotainment system. If the user initiates the start of such a learning process, it can be provided that user preferences are determined depending on a contextual trigger that has already been recorded or is to be recorded. The activation of this learning process can, for example, be set such that the infotainment system should record user preferences for the next half hour or for the next two hours, or (initially) without a time limit. Likewise, it can be provided that no user preferences should be determined for the next half hour or for the next two hours, or (initially) without a time limit. This gives the user control over when user preferences should be recorded. Furthermore, concerns about data protection can be mitigated. During a journey with multiple occupants, for example, different styles of music can be played. In order to prevent the user from being assigned other people's music preferences as user preferences, it is therefore useful to be able to deactivate the learning process manually.

Eine Weiterbildung sieht vor, dass eine Transparenz der abgeleiteten Einstellungen zumindest teilweise durch Anzeige dieser in einem Al-Menü oder einer Benutzerschnittstelle des Infotainmentsystems gewährleistet wird. Mit anderen Worten kann für eine Einstellung offengelegt werden, aus welchen Nutzerpräferenzen diese Einstellung erzielt wurde. Eine Transparenz kann z. B. dadurch gewährleistet sein, dass eine Histone oder ein Protokoll aufgezeigt wird, aus der der Nutzer z. B. eine Nutzerhäufigkeit zu einer Funktion und/oder einem kontextuellen Trigger ablesen kann. Der Nutzer kann dadurch eigene Gewohnheiten und/oder Präferenzen (besser) verstehen. Bei Vorfinden einer „falsch“ gelernten Einstellung, also eine Einstellung, die der Nutzer nicht mag, kann so die Ursache überprüft werden. Durch Gewährleisten einer solchen Transparenz ist es wahrscheinlicher, dass der Nutzer Vertrauen in das Infotainmentsystem entwickelt, wodurch die Benutzerfreundlichkeit verbessert wird. A further development provides that transparency of the derived settings is ensured, at least in part, by displaying them in an AI menu or a user interface of the infotainment system. In other words, for a setting, it can be disclosed from which user preferences this setting was achieved. Transparency can be ensured, for example, by displaying a histone or a protocol from which the user can, for example, read the user frequency for a function and/or a contextual trigger. This allows the user to (better) understand their own habits and/or preferences. If an "incorrectly" learned setting is found, i.e., a setting that the user does not like, the cause can be checked. By ensuring such transparency, it is more likely that the user will trust the Infotainment system developed, improving user experience.

Für Anwendungsfälle oder Anwendungssituationen, die sich bei dem Verfahren ergeben können und die hier nicht explizit beschrieben sind, kann vorgesehen sein, dass gemäß dem Verfahren eine Fehlermeldung und/oder eine Aufforderung zur Eingabe einer Nutzerrückmeldung ausgegeben und/oder eine Standardeinstellung und/oder ein vorbestimmter Initialzustand eingestellt wird. For use cases or application situations that may arise during the method and which are not explicitly described here, it may be provided that, in accordance with the method, an error message and/or a request to enter user feedback is issued and/or a default setting and/or a predetermined initial state is set.

Zu der Erfindung gehört auch ein Infotainmentsystem für ein Kraftfahrzeug. Das Infotainmentsystem kann eine Datenverarbeitungsvorrichtung oder eine Prozessoreinrichtung aufweisen, die dazu eingerichtet ist, eine Ausführungsform des erfindungsgemäßen Verfahrens durchzuführen. Die Prozessoreinrichtung kann hierzu zumindest einen Mikroprozessor und/oder zumindest einen Mikrocontroller und/oder zumindest einen FPGA (Field Programmable Gate Array) und/oder zumindest einen DSP (Digital Signal Processor) aufweisen. Als Mikroprozessor kann insbesondere jeweils eine CPU (Central Processing Unit), eine GPU (Graphical Processing Unit) oder eine NPU (Neural Processing Unit) verwendet werden. Des Weiteren kann die Prozessoreinrichtung Programmcode aufweisen, der dazu eingerichtet ist, bei Ausführen durch die Prozessoreinrichtung die Ausführungsform des erfindungsgemäßen Verfahrens durchzuführen. Der Programmcode kann in einem Datenspeicher der Prozessoreinrichtung gespeichert sein. Die Prozessoreinrichtung kann z.B. auf zumindest einer Schaltungsplatine und/oder auf zumindest einem SoC (System on Chip) basieren. The invention also includes an infotainment system for a motor vehicle. The infotainment system can have a data processing device or a processor device configured to carry out an embodiment of the method according to the invention. For this purpose, the processor device can have at least one microprocessor and/or at least one microcontroller and/or at least one FPGA (Field Programmable Gate Array) and/or at least one DSP (Digital Signal Processor). In particular, a CPU (Central Processing Unit), a GPU (Graphical Processing Unit), or an NPU (Neural Processing Unit) can be used as the microprocessor. Furthermore, the processor device can have program code configured to carry out the embodiment of the method according to the invention when executed by the processor device. The program code can be stored in a data memory of the processor device. The processor device can be based, for example, on at least one circuit board and/or on at least one SoC (System on Chip).

Zu der Erfindung gehören auch Weiterbildungen des erfindungsgemäßen Infotainmentsystems und/oder Kraftfahrzeugs, die Merkmale aufweisen, wie sie bereits im Zusammenhang mit den Weiterbildungen des erfindungsgemäßen Verfahrens beschrieben worden sind. Aus diesem Grund sind die entsprechenden Weiterbildungen hier nicht noch einmal beschrieben. Das erfindungsgemäße Kraftfahrzeug ist bevorzugt als Kraftwagen, insbesondere als Personenkraftwagen oder Lastkraftwagen, oder als Personenbus oder Motorrad ausgestaltet. The invention also includes further developments of the infotainment system and/or motor vehicle according to the invention that have features already described in connection with the further developments of the method according to the invention. For this reason, the corresponding further developments are not described again here. The motor vehicle according to the invention is preferably designed as a motor vehicle, in particular as a passenger car or truck, or as a passenger bus or motorcycle.

Als eine weitere Lösung umfasst die Erfindung auch ein computerlesbares Speichermedium, umfassend Programmcode, der bei der Ausführung durch einen Computer oder einen Computerverbund diesen veranlasst, eine Ausführungsform des erfindungsgemäßen Verfahrens auszuführen. Das Speichermedium kann zumindest teilweise als ein nicht-flüchtiger Datenspeicher (z.B. als eine Flash-Speicher und/oder als SSD - solid state drive) und/oder zumindest teilweise als ein flüchtiger Datenspeicher (z.B. als ein RAM - random access memory) bereitgestellt sein. Das Speichermedium kann in dem Computer oder Computerverbund angeordnet sein. Das Speichermedium kann aber auch beispielsweise als sogenannter Appstore- Server und/oder Cloud-Server im Internet betrieben sein. Durch den Computer oder Computerverbund kann eine Prozessorschaltung mit beispielsweise zumindest einem Mikroprozessor bereitgestellt sein. Der Programmcode kann als Binärcode und/oder als Assembler-Code und/oder als Quellcode einer Programmiersprache (z.B. C) und/oder als Programmskript (z.B. Python) bereitgestellt sein. As a further solution, the invention also encompasses a computer-readable storage medium comprising program code which, when executed by a computer or computer network, causes the computer or computer network to execute an embodiment of the method according to the invention. The storage medium can be provided at least partially as a non-volatile data memory (e.g., as a flash memory and/or as an SSD - solid state drive) and/or at least partially as a volatile data memory (e.g., as a RAM - random access memory). The storage medium can be arranged in the computer or computer network. However, the storage medium can also be operated, for example, as a so-called app store server and/or cloud server on the Internet. The computer or computer network can provide a processor circuit with, for example, at least one microprocessor. The program code can be provided as binary code and/or as assembly code and/or as source code of a programming language (e.g., C) and/or as a program script (e.g., Python).

Die Erfindung umfasst auch die Kombinationen der Merkmale der beschriebenen Ausführungsformen. Die Erfindung umfasst also auch Realisierungen, die jeweils eine Kombination der Merkmale mehrerer der beschriebenen Ausführungsformen aufweisen, sofern die Ausführungsformen nicht als sich gegenseitig ausschließend beschrieben wurden. The invention also encompasses combinations of the features of the described embodiments. The invention therefore also encompasses implementations that each comprise a combination of the features of several of the described embodiments, unless the embodiments are described as mutually exclusive.

Im Folgenden sind Ausführungsbeispiele der Erfindung beschrieben. Hierzu zeigt: Exemplary embodiments of the invention are described below. Shown are:

Fig. 1 ein System zur Durchführung des erfindungsgemäßen Verfahrens; Fig. 2 ein technische Umsetzung zur Durchführung des erfindungsgemäßen Verfahrens; und Fig. 1 shows a system for carrying out the method according to the invention; Fig. 2 shows a technical implementation for carrying out the method according to the invention; and

Fig. 3 eine erfindungsgemäße Ausführungsform in einem Kraftfahrzeug. Fig. 3 shows an embodiment of the invention in a motor vehicle.

Bei den im Folgenden erläuterten Ausführungsbeispielen handelt es sich um bevorzugte Ausführungsformen der Erfindung. Bei den Ausführungsbeispielen stellen die beschriebenen Komponenten der Ausführungsformen jeweils einzelne, unabhängig voneinander zu betrachtende Merkmale der Erfindung dar, welche die Erfindung jeweils auch unabhängig voneinander weiterbilden. Daher soll die Offenbarung auch andere als die dargestellten Kombinationen der Merkmale der Ausführungsformen umfassen. Des Weiteren sind die beschriebenen Ausführungsformen auch durch weitere der bereits beschriebenen Merkmale der Erfindung ergänzbar. The exemplary embodiments explained below are preferred embodiments of the invention. In the exemplary embodiments, the described components of the embodiments each represent individual features of the invention that can be considered independently of one another, each of which also develops the invention independently of one another. Therefore, the disclosure is intended to encompass combinations of the features of the embodiments other than those shown. Furthermore, the described embodiments can also be supplemented by further features of the invention already described.

In den Figuren bezeichnen gleiche Bezugszeichen jeweils funktionsgleiche Elemente. In the figures, the same reference symbols designate elements with the same function.

Fig. 1 zeigt ein System zum Ausführen der bereits beschriebenen Idee. Dieses System kann aus zwei Teilen bestehen. Einmal aus einem bereits existierenden Teil, geni:OS 14 (siehe hierzu auch https://www.semvox.de/technologien/genios/) und einmal aus einem dazu integrierten Question-Answering Model 13. In geni:OS 14 kann ein geni:OS IQA Agent 1 integriert sein, der mit folgenden Komponenten in Interaktion steht. Diese Komponenten können bereits beschriebene Sensoren 6 und/oder eine Dialoghistone oder Interaktionshistorie oder Protokoll 4 und/oder fehlende Informationen 12 sein. Diese fehlenden Informationen 12 können aus einem zentralen Nutzerprofil 3 entnommen werden. Mit anderen Worten können bei Erkennen von fehlenden Informationen 12, diese fehlenden Informationen 12 aus dem zentralen Nutzerprofil 3 extrahiert werden. Z. B. könnte für das Formulieren eines Hinweises 11 , die Information relevant sein, welche Musik ein Nutzer 33 gerne hört, sodass eben diese Information aus dem zentralen Nutzerprofil 3 entnommen wird. Jede dieser Komponenten 6, 4, 12 kann jeweils mit einem Encoder-Netzwerk 2, 2‘ beziehungsweise 2“ verbunden sein, wodurch sogenannte hidden states entstehen. Hieraus kann dann eine Konkatenation 8 erfolgen, sodass eben diese hidden states zusammengefasst werden. Zusätzlich oder alternativ kann vorgesehen sein, dass der geni:OS IQA Agent 1 aus der Dialoghistone 4 und/oder den fehlenden Informationen 12 z. B. mittels eines Neural Style Transfer-Modells eine Sprachstiladaption 9 durchführt. Diese Sprachstiladaption 9 kann an die Konkatenation 8 hinzugefügt werden, sodass der Inhalt der Konkatenation 8 durch die Sprachstiladaption 9 angepasst wird. Anschließend kann dieser Inhalt einem Decoder-Netzwerk 10 zugeführt werden. Es ist insgesamt vorgesehen, dass das Question-Answering-Model oder eben das künstliche neuronale Netzwerk 13, wie bereits beschrieben mittels Reinforcement Learning auf Datensätzen (Erfahrungsdatensätzen), bestehend aus Frage-Antwort-Paaren aus einem Fragenkorpus 5, darauf trainiert ist, Hinweise oder Fragen 11 in Abhängigkeit von zumindest einem kontextuellen Trigger 15 und/oder eines ermittelten Zeitpunkts 16 zu formulieren. Ein erstellter Hinweis 11 kann an den geni:OS IQA Agent 1 gesendet werden, welcher diesen dann als Sprachausgabe wiedergibt. Mit dem geni:OS IQA Agent 1 kann also ein konkretes Sprachdialogsystem gemeint sein. Fig. 1 shows a system for implementing the idea described above. This system can consist of two parts: one is an existing part, geni:OS 14 (see also https://www.semvox.de/technologien/genios/), and the other is an integrated question-answering model 13. A geni:OS IQA agent 1 can be integrated into geni:OS 14, which interacts with the following components. These components can be previously described sensors 6 and/or a dialog histone or interaction history or protocol 4 and/or missing information 12. This missing information 12 can be extracted from a central user profile 3. In other words, if missing information 12 is detected, this missing information 12 can be extracted from the central user profile 3. For example, for formulating a hint 11, the information about which music a user 33 likes to listen to could be relevant, so this information is extracted from the central user profile 3. Each of these components 6, 4, 12 can be connected to an encoder network 2, 2' or 2", respectively, creating so-called hidden states. From this, a concatenation 8 can then be performed, so that these hidden states are summarized. Additionally or alternatively, it can be provided that the geni:OS IQA agent 1 performs a language style adaptation 9 from the dialogue histone 4 and/or the missing information 12, e.g., using a neural style transfer model. This language style adaptation 9 can be added to the concatenation 8, so that the content of the concatenation 8 is adapted by the language style adaptation 9. This content can then be fed to a decoder network 10. Overall, it is provided that the question answering model or the artificial neural network 13, as already described, is trained by means of reinforcement learning on data sets (experience data sets) consisting of question-answer pairs from a question corpus 5, to detect clues or formulate questions 11 depending on at least one contextual trigger 15 and/or a determined time 16. A generated hint 11 can be sent to the geni:OS IQA Agent 1, which then reproduces it as a voice output. The geni:OS IQA Agent 1 can therefore refer to a specific voice dialog system.

Fig. 2 zeigt eine technische Umsetzung der Idee. Ein bereits beschriebener kontextueller Trigger 15 kann z. B. ermittelt werden und/oder durch haptische und/oder sprachliche Interaktion signalisiert werden. Des Weiteren kann ein ebenfalls beschriebener Zeitpunkt 16, zu dem ein Nutzer 33 empfänglich für einen Hinweis 11 ist, durch verschiedene, bereits oben genannte Sensoren 6 ermittelt werden. Diese Sensoren 6 können eine Emotion und/oder eine Belastung und/oder ein Müdigkeitslevel des Nutzers 33 ermitteln und/oder auswerten. Eine Datenfusion 17 kann anhand des ermittelten Zeitpunkts 16 sowie durch Hinzunahme von Nutzerpräferenzen aus dem zentralen Nutzerprofil 3 durchgeführt werden. Diese Datenfusion 17 kann die Dialoghistone 4 und/oder einen Regelsatz 18, zur Durchführung dieser Datenfusion 17, aufweisen. Ein Ergebnis 19 kann daraus resultieren. Hierzu kann vorgesehen sein, dass das Ergebnis 19 einem Vollständigkeitskriterium unterzogen wird, sodass eine Vollständigkeit oder eben eine Unvollständigkeit signalisiert wird. Dieses Vollständigkeitskriterium kann z. B. eine erreichte Konfidenz sein, wobei diese Konfidenz aus der Dialoghistorie 4 berechnet oder abgelesen werden kann. Ist also diese Konfidenz unter einem vorgegebenen Schwellenwert, kann das Sprachdialogsystem 1 dazu veranlasst werden einen Hinweis 11 zu formulieren. Hierzu kann z. B. aus einem Fragenkorpus 5, aufweisend Frage-Antwort-Paare eine bereits vorhandene Frage entnommen werden und/oder gestellt werden, sodass eben ein Hinweis 11 formuliert wird. Auf diesen Hinweis 11 kann die besagte Sprachstiladaption 9 durchgeführt werden. Ein Resultat daraus kann eine reformulierte Frage 24 sein, worauf im Anschluss ein Frage-Antwort-Dialog 25 geführt werden kann. Dieser Frage- Antwort-Dialog 25 kann dann einer Auswertung 28 unterzogen werden. Fig. 2 shows a technical implementation of the idea. A previously described contextual trigger 15 can, for example, be determined and/or signaled by haptic and/or verbal interaction. Furthermore, a time 16, also described, at which a user 33 is receptive to a hint 11 can be determined by various sensors 6 already mentioned above. These sensors 6 can determine and/or evaluate an emotion and/or a stress and/or a fatigue level of the user 33. A data fusion 17 can be performed based on the determined time 16 and by adding user preferences from the central user profile 3. This data fusion 17 can comprise the dialog histone 4 and/or a rule set 18 for implementing this data fusion 17. A result 19 can result therefrom. It can be provided that the result 19 is subjected to a completeness criterion, so that completeness or incompleteness is signaled. This completeness criterion can, for example, be an achieved confidence, whereby this confidence can be calculated or read from the dialogue history 4. If this confidence is below a predetermined threshold value, the speech dialogue system 1 can be prompted to formulate a hint 11. For this purpose, for example, an existing question can be taken and/or asked from a question corpus 5 comprising question-answer pairs, so that a hint 11 is formulated. The aforementioned language style adaptation 9 can be carried out on this hint 11. The result of this can be a reformulated question 24, after which a question-answer dialogue 25 can be conducted. This question-answer dialogue 25 can then be subjected to an evaluation 28.

Ist die Konfidenz jedoch über einem vorgegebenen Schwellenwert, kann das bedeuten, dass eine bereits erlernte Aktion 21 ausgeführt werden soll. Dabei kann ein Bestätigungsprompt 22 an den Nutzer 33 gestellt werden. Eine Reaktion 23 des Nutzers 33 kann dann ermittelt oder erfasst werden. Im Anschluss darauf kann eine Auswertung der Interaktion 28 durchgeführt werden. Beinhaltet diese Auswertung 28 eine Konfidenz unter einem Schwellenwert, so wird das Ergebnis als unvollständig erachtet und ein solches Signal an ein Reformulierungsmodell 30 gesendet, um eine reformulierte Frage 31 zu erstellen. Bei dieser reform ulierten Frage 31 kann es sich z. B. um eine Erklärung, Empfehlung oder Folgefrage handeln. Anhand dieser reform ulierten Frage 31 kann erneut ein Frage-Antwort-Dialog 25 durchgeführt werden, wobei dieser im Anschluss erneut einer Auswertung 28 unterzogen wird. Der Frage-Antwort-Dialog 25 kann auf einem NLU (Neural Language Understanding)-Korpus 26 und/oder auf einer Emotionserkennung 27 und/oder auf einer Dialoghistorie oder Interaktionshistorie 4 basieren. Wird das Ergebnis als vollständig erachtet, so kann die Interaktion als Aktion erlernt oder verfeinert oder sogar verworfen werden, so dass eine Adaption der Kl- Interaktion 29 durchgeführt wird. Fig. 3 zeigt, den Nutzer 33 in einem Kraftfahrzeug 32. Dieses Kraftfahrzeug 32 umfasst ein Infotainmentsystem 35, das eine Prozessoreinrichtung 36 aufweist. Zudem beinhaltet das Infotainmentsystem 35 das Sprachdialogsystem 1. Des Weiteren weist das Kraftfahrzeug 32 einen Temperatursensor 6 auf. Symbolisch dargestellt ist eine Außentemperatur 37 von - 5 Grad Celsius. Diese Außentemperatur 37 kann als kontextueller Trigger 15 über den Temperatursensor 6 im Infotainmentsystem 35 erfasst werden. Als nächstes kann ein Zeitpunkt 16, zu dem der Nutzer 33 für einen Hinweis 11 empfänglich ist, ermittelt werden. Wird ein solcher Zeitpunkt 16 ermittelt, kann der Hinweis 11 an den Nutzer 33, basierend auf dem erfassten kontextuellen Trigger 15 und dem ermittelten Zeitpunkt 16 formuliert werden, wobei der Hinweis 11 darauf abzielt, Nutzerpräferenzen des Nutzers 33 zu ermitteln. Dieser Hinweis 11 ist symbolisch als ein Fragezeichen abgebildet. In Abhängigkeit von der Reaktion 23 des Nutzers 33 auf den Hinweis 11 können Nutzerpräferenzen ermittelt werden. Basierend auf den Nutzerpräferenzen kann ein Nutzerprofil erstellt werden. Aus den ermittelten Nutzerpräferenzen können dann Einstellungen 38 des Infotainmentsystems 35 abgeleitet und angewendet werden. However, if the confidence is above a predetermined threshold, this may mean that an already learned action 21 should be carried out. A confirmation prompt 22 can be sent to the user 33. A reaction 23 from the user 33 can then be determined or recorded. Following this, an evaluation of the interaction 28 can be carried out. If this evaluation 28 contains a confidence below a threshold, the result is considered incomplete and such a signal is sent to a reformulation model 30 in order to create a reformulated question 31. This reformulated question 31 can be, for example, an explanation, recommendation or follow-up question. Based on this reformulated question 31, a question-answer dialogue 25 can be carried out again, which is then subjected to another evaluation 28. The question-and-answer dialogue 25 can be based on an NLU (Neural Language Understanding) corpus 26 and/or on emotion recognition 27 and/or on a dialogue history or interaction history 4. If the result is considered complete, the interaction can be learned or refined as an action, or even discarded, so that an adaptation of the AI interaction 29 is performed. Fig. 3 shows the user 33 in a motor vehicle 32. This motor vehicle 32 comprises an infotainment system 35 having a processor device 36. The infotainment system 35 also includes the voice dialogue system 1. Furthermore, the motor vehicle 32 has a temperature sensor 6. Symbolically represented is an outside temperature 37 of -5 degrees Celsius. This outside temperature 37 can be detected as a contextual trigger 15 via the temperature sensor 6 in the infotainment system 35. Next, a time 16 at which the user 33 is receptive to a hint 11 can be determined. If such a time 16 is determined, the hint 11 can be formulated to the user 33 based on the detected contextual trigger 15 and the determined time 16, wherein the hint 11 aims to determine user preferences of the user 33. This hint 11 is symbolically depicted as a question mark. Depending on the user's 33 reaction 23 to the notification 11, user preferences can be determined. A user profile can be created based on the user preferences. Settings 38 of the infotainment system 35 can then be derived and applied from the determined user preferences.

Insgesamt zeigen die Beispiele, wie ein Inverse-Question-Answering (IQA) Sprachdialogsystem bereitgestellt werden kann. Overall, the examples show how an Inverse Question Answering (IQA) speech dialogue system can be provided.

Bezugszeichenliste List of reference symbols

1 Sprachdialogsystem 1 speech dialogue system

2 Encoder Block 1 2 Encoder Block 1

2‘ Encoder Block 2 2‘ Encoder Block 2

2“ Encoder Block 3 2" Encoder Block 3

4 Dialoghistone 4 dialogue histones

5 Fragenkorpus 5 question corpus

6 Sensorvorrichtung 6 Sensor device

7 Kantenendpunkt 7 Edge endpoint

8 Konkatenation 8 Concatenation

9 Sprachstiladaption 9 Language style adaptation

10 Decoder 10 decoders

11 Hinweis 11 Note

12 fehlende Information 12 missing information

13 Inverse QA Model 13 Inverse QA Model

14 geni:OS Kl Interaktion 14 geni:OS Kl Interaction

15 kontextueller Trigger 15 contextual triggers

16 Zeitpunkt 16 Time

17 Datenfusion 17 Data fusion

18 Regelsatz 18 Standard rate

19 Ergebnis 19 results

20 Inverse QA 20 Inverse QA

21 Erlernte Aktion 21 Learned Action

22 Bestätigungsprompt 22 Confirmation prompt

23 Reaktion 23 Reaction

24 reform ulierte Frage 24 reformed question

25 Frage-Antwort-Dialog 25 Question-Answer Dialogue

26 NLU-Korpus 26 NLU corpus

27 Emotionserkennung 27 Emotion recognition

28 Auswertung 28 Evaluation

29 Adaption der Kl-Interaktion29 Adaptation of the AI interaction

30 Reformulierungsmodell30 Reformulation model

32 Kraftfahrzeug 33 Nutzer 32 Motor vehicle 33 users

35 Infotainmentsystem35 Infotainment system

36 Prozessoreinrichtung36 Processor setup

37 Außentemperatur 38 Einstellung 37 Outside temperature 38 Setting

Claims

PATENTANSPRÜCHE: PATENT CLAIMS: 1 . Verfahren zur Anpassung eines in einem Kraftfahrzeug (32) umfassten Infotainmentsystems (35) an Nutzerpräferenzen, wobei das Verfahren umfasst: a) Erfassen eines kontextuellen Triggers (15), b) Ermitteln eines Zeitpunkts (16), zu dem ein Nutzer (33) für einen Hinweis (11 ) empfänglich ist, c) Formulieren des Hinweises (11 ) an den Nutzer (33), basierend auf dem erfassten kontextuellen Trigger (15) und dem ermittelten Zeitpunkt (16), wobei der Hinweis (11 ) darauf abzielt, Nutzerpräferenzen des Nutzers (33) zu ermitteln, d) in Abhängigkeit von der Reaktion (23) des Nutzers (33) auf den Hinweis (11 ): Ermitteln der Nutzerpräferenzen, e) Erstellen eines Nutzerprofils basierend auf den ermittelten Nutzerpräferenzen, f) Ableiten von Einstellungen (38) des Infotainmentsystems (35) aus den ermittelten Nutzerpräferenzen und Anwenden dieser Einstellungen (38). 1 . Method for adapting an infotainment system (35) included in a motor vehicle (32) to user preferences, the method comprising: a) detecting a contextual trigger (15), b) determining a time (16) at which a user (33) is receptive to an indication (11), c) formulating the indication (11) to the user (33) based on the detected contextual trigger (15) and the determined time (16), the indication (11) aiming to determine user preferences of the user (33), d) depending on the reaction (23) of the user (33) to the indication (11): determining the user preferences, e) creating a user profile based on the determined user preferences, f) deriving settings (38) of the infotainment system (35) from the determined user preferences and applying these settings (38). 2. Verfahren nach Anspruch 1 , wobei der Hinweis (11 ) auf eine Funktion abzielt, die der Nutzer (33) bis zum Zeitpunkt (16) des Erhalts des Hinweises (11 ) noch nicht aktiviert hat und/oder die Nutzungshäufigkeit des Nutzers (33) für diese Funktion einen vorbestimmten Schwellenwert unterschreitet. 2. Method according to claim 1, wherein the indication (11) refers to a function which the user (33) has not yet activated by the time (16) of receiving the indication (11) and/or the frequency of use of the user (33) for this function falls below a predetermined threshold. 3. Verfahren nach Anspruch 2, wobei die Nutzungshäufigkeit mittels einer Historie (4) ermittelt wird, wobei die Histone (4) quantifiziert, welche Funktionen des Kraftfahrzeugs (32) und/oder wie oft diese bereits in der Vergangenheit aktiviert wurden, während der Nutzer (33) als Insasse registriert war. 3. The method according to claim 2, wherein the frequency of use is determined by means of a history (4), wherein the histone (4) quantifies which functions of the motor vehicle (32) and/or how often these have already been activated in the past while the user (33) was registered as an occupant. 4. Verfahren nach einem der vorhergehenden Ansprüche, wobei in Schritt a) der kontextuelle Trigger (15) umfasst: eine voraussichtliche Fahrdauer und/oder ein geplantes Fahrziel und/oder die aktuelle Außentemperatur (37) und/oder das Nutzungsprofil des Nutzers (33). 4. Method according to one of the preceding claims, wherein in step a) the contextual trigger (15) comprises: an expected travel time and/or a planned travel destination and/or the current outside temperature (37) and/or the usage profile of the user (33). 5. Verfahren nach einem der vorhergehenden Ansprüche, wobei in Schritt b) das Ermitteln eines Zeitpunkts (16) in Abhängigkeit von einer Fahrgeschwindigkeit und/oder einer Innenraum lautstärke des Kraftfahrzeugs (32) und/oder einer ermittelten Anzahl von Insassen im Kraftfahrzeug (32) und/oder einer umgebenden Verkehrsdichte erfolgt. 5. Method according to one of the preceding claims, wherein in step b) the determination of a time (16) as a function of a driving speed and/or an interior noise of the Motor vehicle (32) and/or a determined number of occupants in the motor vehicle (32) and/or a surrounding traffic density. 6. Verfahren nach einem der vorhergehenden Ansprüche, wobei Schritt c) auf einem „Active Question Answering“-Sprachdialog (25) basiert, wobei dieser von einem Sprachdialogsystem (1 ) initiiert und mit dem Nutzer (33) durchgeführt wird. 6. Method according to one of the preceding claims, wherein step c) is based on an "Active Question Answering" voice dialogue (25), which is initiated by a voice dialogue system (1) and carried out with the user (33). 7. Verfahren nach Anspruch 6, wobei das Sprachdialogsystem (1 ) ein künstliches neuronales Netzwerk aufweist, und mittels Reinforcement Learning auf Datensätzen, bestehend aus Frage-Antwort-Paaren, darauf trainiert ist, Hinweise (11 ) in Abhängigkeit von zumindest einem kontextuellen Trigger (15) und/oder eines ermittelten Zeitpunkts (16) zu formulieren. 7. The method according to claim 6, wherein the speech dialogue system (1) comprises an artificial neural network and is trained by means of reinforcement learning on data sets consisting of question-answer pairs to formulate instructions (11) depending on at least one contextual trigger (15) and/or a determined time (16). 8. Verfahren nach Anspruch 6 oder 7, wobei die Schritte b) bis e) übersprungen werden, sobald das künstliche neuronale Netzwerk signalisiert, dass ein vorgegebener Schwellenwert für den kontextuellen Trigger (15) erreicht ist. 8. The method according to claim 6 or 7, wherein steps b) to e) are skipped as soon as the artificial neural network signals that a predetermined threshold value for the contextual trigger (15) is reached. 9. Verfahren nach einem der vorhergehenden Ansprüche, wobei Schritt c) beinhaltet, dass die Frage umformuliert wird, falls keine9. Method according to one of the preceding claims, wherein step c) includes reformulating the question if no Nutzerpräferenzen ermittelt werden konnten und/oder falls eine Ratlosigkeitsgeste des Nutzers (33) ermittelt wird, wobei das Umformulieren umfasst, dass eine Frage gestellt wird, die direkt nach der initial formulierten Frage gemäß einer geordneten Wahrscheinlichkeitsliste basierend auf Ergebnissen des Sprachdialogs positioniert ist. User preferences could be determined and/or if a gesture of perplexity of the user (33) is determined, wherein the reformulating comprises asking a question which is positioned directly after the initially formulated question according to an ordered probability list based on results of the voice dialogue. 10. Verfahren nach einem der vorhergehenden Ansprüche, wobei die Ratlosigkeitsgeste umfasst, dass durch eine bildbasierte und/oder radarbasierte und/oder lidarbasierte und/oder mikrofonbasierte Nutzerüberwachung (6) erkannt wird, dass der Nutzer (33) als Reaktion (23) auf ein von dem Infotainmentsystem (35) ausgegebenen Hinweis (11 ) hin, mit den Schulter zuckt und/oder die Stirn runzelt und/oder stöhnt und/oder eine vorbestimmte Geste zur Anforderung von Hilfe ausführt. 10. The method according to any one of the preceding claims, wherein the gesture of helplessness comprises detecting by image-based and/or radar-based and/or lidar-based and/or microphone-based user monitoring (6) that the user (33) shrugs his shoulders and/or frowns and/or groans and/or performs a predetermined gesture to request help in response (23) to an indication (11) issued by the infotainment system (35). 11. Verfahren nach einem der vorhergehenden Ansprüche, wobei als Reaktion (23) zumindest eine der folgenden erfasst wird: eine verbale und/oder haptische Rückmeldung, eine Geste, eine vergangene Zeitdauer, eine Änderung in den Benutzereinstellungen (38) eine emotionale Reaktion. 11. Method according to one of the preceding claims, wherein at least one of the following is detected as reaction (23): a verbal and/or haptic feedback, a gesture, a period of time passed, a change in user preferences (38) an emotional reaction. 12. Verfahren nach einem der vorhergehenden Ansprüche, wobei ein Aktivieren oder Deaktivieren zum Ableiten von zumindest einer Einstellung (38) in Abhängigkeit von einer manuellen Eingabe angesteuert wird. 12. Method according to one of the preceding claims, wherein activation or deactivation for deriving at least one setting (38) is controlled in dependence on a manual input. 13. Verfahren nach einem der vorhergehenden Ansprüche, wobei eine Transparenz der abgeleiteten Einstellungen (38) zumindest teilweise durch Anzeige dieser in einem Al-Menü des Infotainmentsystems (35) gewährleistet wird. 13. Method according to one of the preceding claims, wherein transparency of the derived settings (38) is ensured at least partially by displaying them in an AI menu of the infotainment system (35). 14. Infotainmentsystem (35) nach einem der vorhergehenden Ansprüche, wobei das Infotainmentsystem (35) eine Prozessoreinrichtung (36) aufweist, die Programm Instruktionen aufweist, die bei Ausführen durch die Prozessoreinrichtung (36) diese veranlassen, ein Verfahren nach einem der vorhergehenden Verfahrensansprüche durchzuführen. 14. Infotainment system (35) according to one of the preceding claims, wherein the infotainment system (35) comprises a processor device (36) which comprises program instructions which, when executed by the processor device (36), cause it to carry out a method according to one of the preceding method claims. 15. Kraftfahrzeug (32), aufweisend ein Infotainmentsystem (35) nach Anspruch 14. 15. Motor vehicle (32) comprising an infotainment system (35) according to claim 14.
PCT/EP2025/051496 2024-02-21 2025-01-22 Method for adapting an infotainment system, infotainment system, and motor vehicle Pending WO2025176402A1 (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
DE102024104789.5A DE102024104789A1 (en) 2024-02-21 2024-02-21 Method for adapting an infotainment system and infotainment system and motor vehicle
DE102024104789.5 2024-02-21

Publications (1)

Publication Number Publication Date
WO2025176402A1 true WO2025176402A1 (en) 2025-08-28

Family

ID=94393615

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/EP2025/051496 Pending WO2025176402A1 (en) 2024-02-21 2025-01-22 Method for adapting an infotainment system, infotainment system, and motor vehicle

Country Status (2)

Country Link
DE (1) DE102024104789A1 (en)
WO (1) WO2025176402A1 (en)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170190337A1 (en) * 2014-05-01 2017-07-06 Jaguar Land Rover Limited Communication system and related method
DE102019217233A1 (en) * 2019-11-07 2021-05-12 Volkswagen Aktiengesellschaft Method for controlling a first and a second vehicle functionality for acting on a vehicle occupant while driving in a vehicle
US20210326344A1 (en) 2020-04-20 2021-10-21 Optum, Inc. Generating proactive audiovisual queries using virtual assistant software applications
US20220051669A1 (en) 2018-09-25 2022-02-17 Sony Corporation Information processing device, information processing method, computer program, and interaction system
US20220089086A1 (en) * 2020-09-24 2022-03-24 Harman International Industries, Incorporated Techniques for automatically reducing annoyance levels of drivers when using driver monitoring systems

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060036430A1 (en) * 2004-08-12 2006-02-16 Junling Hu System and method for domain-based natural language consultation
DE102012220131A1 (en) * 2012-11-06 2014-05-08 Robert Bosch Gmbh A method of activating voice interaction with an occupant of a vehicle and voice interaction system for a vehicle
DE102015216484A1 (en) * 2015-08-28 2017-03-02 Robert Bosch Gmbh Method and apparatus for providing a recommendation signal for controlling at least one function in a vehicle
DE102017213235A1 (en) * 2017-08-01 2019-02-07 Audi Ag A method for determining a user feedback when using a device by a user and control device for performing the method
DE102018133674A1 (en) * 2018-12-28 2020-07-02 Volkswagen Aktiengesellschaft Method and device for generating control signals for assisting occupants of a vehicle
DE102020202372A1 (en) * 2020-02-25 2021-08-26 Elektrobit Automotive Gmbh Adjustment of settings for media playback in a vehicle
DE102021108765A1 (en) * 2021-04-08 2022-10-13 Cariad Se Method, processor circuit and operating system for providing context-sensitive tutorials for a device
DE102022204339A1 (en) * 2022-05-03 2023-11-09 Volkswagen Aktiengesellschaft Driver assistance system, means of transport and method for operating a driver assistance system of a means of transport

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170190337A1 (en) * 2014-05-01 2017-07-06 Jaguar Land Rover Limited Communication system and related method
US20220051669A1 (en) 2018-09-25 2022-02-17 Sony Corporation Information processing device, information processing method, computer program, and interaction system
DE102019217233A1 (en) * 2019-11-07 2021-05-12 Volkswagen Aktiengesellschaft Method for controlling a first and a second vehicle functionality for acting on a vehicle occupant while driving in a vehicle
US20210326344A1 (en) 2020-04-20 2021-10-21 Optum, Inc. Generating proactive audiovisual queries using virtual assistant software applications
US20220089086A1 (en) * 2020-09-24 2022-03-24 Harman International Industries, Incorporated Techniques for automatically reducing annoyance levels of drivers when using driver monitoring systems

Also Published As

Publication number Publication date
DE102024104789A1 (en) 2025-08-21

Similar Documents

Publication Publication Date Title
DE102019119171A1 (en) VOICE RECOGNITION FOR VEHICLE VOICE COMMANDS
DE102013222507B4 (en) Method for adapting a speech system
DE102013223036B4 (en) Adaptation methods for language systems
DE112016004863T5 (en) Parameter collection and automatic dialog generation in dialog systems
DE112017007922T5 (en) IDENTIFY AND REDUCE VEHICLE ODORS
DE102015109758B4 (en) Methods and systems for adapting speech systems
DE102014109122A1 (en) Systems and methods for result-based arbitration in speech dialogue systems
DE102018108947A1 (en) Apparatus for correcting an utterance error of a user and method thereof
DE102013007502A1 (en) Computer-implemented method for automatically training a dialogue system and dialog system for generating semantic annotations
DE102017101238A1 (en) LANGUAGE RECOGNITION SYSTEMS AND METHOD FOR AUTOMATED DRIVING
DE102020100497A1 (en) SYSTEMS AND METHODS OF VEHICLE-BASED REAL-TIME ANALYSIS AND USES THEREOF
DE102013222757A1 (en) Adaptation methods and systems for speech systems
EP1926081A1 (en) Method for dialogue adaptation and dialogue system for this purpose
DE102019218918A1 (en) DIALOGUE SYSTEM, ELECTRONIC DEVICE AND METHOD OF CONTROLLING THE DIALOGUE SYSTEM
EP3735688B1 (en) Method, device and computer-readable storage medium having instructions for processing a speech input, motor vehicle, and user terminal with speech processing
DE102018133670A1 (en) Method and device for generating control signals for assisting occupants of a vehicle
DE102022003532A1 (en) Voice dialogue system and method for its operation and vehicle
WO2025176402A1 (en) Method for adapting an infotainment system, infotainment system, and motor vehicle
EP1121684A1 (en) Method and device for information and/or messages by means of speech
DE102018132160A1 (en) SYSTEM AND METHOD FOR UNDERSTANDING STANDARD LANGUAGE AND DIALECTS
DE102020132456A1 (en) Agent system, agent processing method and agent processing program
DE102020100638A1 (en) System and method for a dialogue with a user
DE102018130754A1 (en) SEAMLESS ADVISOR INTERVENTION
EP3895162B1 (en) Method for operating an interactive information system for a vehicle, and vehicle
DE102020131652A1 (en) Agent device, agent system and computer readable storage medium

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 25702164

Country of ref document: EP

Kind code of ref document: A1