[go: up one dir, main page]

WO2013011620A1 - マルチプロセッサシステム - Google Patents

マルチプロセッサシステム Download PDF

Info

Publication number
WO2013011620A1
WO2013011620A1 PCT/JP2012/003704 JP2012003704W WO2013011620A1 WO 2013011620 A1 WO2013011620 A1 WO 2013011620A1 JP 2012003704 W JP2012003704 W JP 2012003704W WO 2013011620 A1 WO2013011620 A1 WO 2013011620A1
Authority
WO
WIPO (PCT)
Prior art keywords
instruction
processor
processing
specifying
processing request
Prior art date
Application number
PCT/JP2012/003704
Other languages
English (en)
French (fr)
Inventor
広之 森下
Original Assignee
パナソニック株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by パナソニック株式会社 filed Critical パナソニック株式会社
Priority to CN201280035369.5A priority Critical patent/CN103718158B/zh
Priority to US14/232,389 priority patent/US9317287B2/en
Publication of WO2013011620A1 publication Critical patent/WO2013011620A1/ja

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/36Prevention of errors by analysis, debugging or testing of software
    • G06F11/362Debugging of software
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/30Arrangements for executing machine instructions, e.g. instruction decode
    • G06F9/30145Instruction analysis, e.g. decoding, instruction word fields
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/30Arrangements for executing machine instructions, e.g. instruction decode
    • G06F9/30181Instruction operation extension or modification
    • G06F9/30185Instruction operation extension or modification according to one or more bits in the instruction, e.g. prefix, sub-opcode
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/30Arrangements for executing machine instructions, e.g. instruction decode
    • G06F9/38Concurrent instruction execution, e.g. pipeline or look ahead
    • G06F9/3836Instruction issuing, e.g. dynamic instruction scheduling or out of order instruction execution
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/30Arrangements for executing machine instructions, e.g. instruction decode
    • G06F9/38Concurrent instruction execution, e.g. pipeline or look ahead
    • G06F9/3877Concurrent instruction execution, e.g. pipeline or look ahead using a slave processor, e.g. coprocessor

Definitions

  • the present invention relates to a technique for improving software debugging efficiency in a multiprocessor system including a main processor and a coprocessor.
  • the performance is improved by using a high-performance processor that greatly improves the calculation efficiency by providing a coprocessor specialized for a specific calculation.
  • Patent Document 1 discloses a configuration in which instruction execution operations of a main processor and a coprocessor (FPU: Floating Point number processing Unit) are changed by setting an execution mode.
  • the instruction execution mode (serial scalar) of the main processor and the coprocessor (FPU) is unified, and the instruction execution mode of the main processor is set to the coprocessor when a floating point instruction (corresponding to the coprocessor) is executed. Control to adjust to (FPU) side is performed. Thereby, the main processor and the coprocessor can be processed simultaneously.
  • the instruction execution mode on the main processor side can be synchronized with the operation on the coprocessor side to simplify the operation and improve the performance.
  • the software for the main processor and the coprocessor can be improved. There is a problem that debugging efficiency is lowered.
  • an object of the present invention is to provide a multiprocessor system and method capable of efficiently debugging the operation of one processor and the operation of another processor.
  • the present invention provides a multiprocessor system having a first processor and a second processor that executes processing upon receiving a notification from the first processor, wherein the first processor includes: Determining means for determining whether or not the debug mode is set, specifying means for sequentially specifying instructions to be executed from the instruction sequence, and the second instruction when the specified instruction is a processing request instruction A notification is sent to the processor based on the processing request, and if it is not a processing request command, execution means for executing the specified command and detection that the second processor has completed the processing according to the notification are detected. Detecting means, and the specifying means specifies the processing request instruction when the determining means determines that the debug mode is set. Decree particular stops, the completion is characterized by resuming the particular instruction to be detected.
  • the multiprocessor system determines that the debug mode is set by the determination unit, when the processing request instruction is specified, the subsequent instruction specification is stopped, and the completion is detected. Resume instruction identification. Thereby, the multiprocessor stops specifying the subsequent instructions after specifying the processing request instruction, so that the instruction processed by the second processor and the instructions after specifying the processing request instruction are not issued in parallel. So you can debug efficiently.
  • FIG. 1 is a diagram showing a configuration of a multiprocessor system 10.
  • FIG. It is a flowchart which shows issue command determination processing. It is a figure explaining the process of the main processor 11 and the coprocessor 12 in the case of a normal mode. It is a figure explaining the process of the main processor 11 and the coprocessor 12 in the case of debug mode.
  • 1 is a diagram illustrating a configuration of a multiprocessor system 1000.
  • FIG. It is a flowchart which shows issue command determination processing. It is a figure explaining the process of the main processor 1001 and the coprocessor 1002 in the case of a 2nd debug mode.
  • 2 is a diagram for explaining a decoding process using a multiprocessor system 10.
  • FIG. 2 is a diagram for explaining an encoding process using a multiprocessor system 10.
  • Patent Document 1 can simplify the operation and improve the performance by synchronizing the instruction execution mode on the main processor side with the operation on the coprocessor side.
  • a multiprocessor system having a first processor and a second processor that executes a process upon receiving a notification from the first processor, the first processor has a debug mode set.
  • Determining means for determining whether or not there are, specifying means for sequentially specifying an instruction to be executed from the instruction sequence, and if the specified instruction is a processing request instruction, the processing is performed on the second processor.
  • An execution unit that performs notification based on the request and executes the specified command if the command is not a processing request command; and a detection unit that detects that the second processor has completed the processing according to the notification;
  • the specifying unit stops specifying the subsequent command when the processing request command is specified, Serial completion, characterized in that to resume the particular instruction to be detected.
  • FIG. 1 is a block diagram showing a configuration of a multiprocessor system 10 according to the first embodiment.
  • the multiprocessor system 10 includes a main processor 11 and a coprocessor 12 as shown in FIG.
  • the main processor 11 and the coprocessor 12 perform processing in parallel.
  • debug mode is set, parallel processing is not performed.
  • the main processor 11 includes an instruction memory 101, an instruction fetch control unit 102, an instruction group determination unit 103, an instruction buffer 104, an issued instruction determination unit 105, a register file 106, an operation
  • the device group 107, the data memory 109, the write back bus 110, and the debug mode determination unit 111 are configured.
  • Instruction memory 101 is a memory that holds instructions executed in the main processor 11 and holds an instruction stream that is a combination of a plurality of instructions.
  • Instruction fetch control unit 102 holds a program counter (PC), reads the next instruction to be executed from the instruction memory, and updates the program counter value to the value of the next read instruction.
  • PC program counter
  • the instruction fetch control unit 102 receives a branch processing request to a special processing vector corresponding to execution of a branch instruction and occurrence of an exception from the arithmetic unit group 107, and controls a read program counter.
  • Instruction group determination unit 103 reads an instruction belonging to the instruction stream from the instruction memory 101, performs decoding, and writes it to the instruction buffer 104.
  • Instruction buffer 104 receives and holds instructions belonging to the instruction stream.
  • Debug mode determination unit 111 determines whether or not the debug mode is set.
  • the debug mode determination unit 111 holds the debug mode designation register, determines whether or not the debug mode is based on the value, and notifies the issue instruction determination unit 105 of the result.
  • the debug mode designation register is a control register set by software.
  • Issued instruction determination unit 105 determines an instruction to be issued for each machine cycle from the instruction buffer 104, and executes an instruction in the main processor 11 and requests a process to the coprocessor 12 according to the determined instruction.
  • the issue command determination unit 105 includes a command specification unit 201, a command execution unit 202, and a detection unit 203, as shown in FIG.
  • the instruction specifying unit 201 specifies an instruction to be issued from the instruction buffer 104 for each machine cycle. In the case where the debug mode determination unit 111 determines that the debug mode is set, the instruction specifying unit 201 stops specifying the instruction to be issued when the coprocessor 12 is executing a process. When processing is completed, the instruction specification is resumed.
  • the command execution unit 202 When the command specified by the command specifying unit 201 is a processing request command to the coprocessor 12, the command execution unit 202 notifies the coprocessor 12 based on the processing request (hereinafter referred to as a startup command). Do.
  • the specified instruction is an instruction other than a processing request instruction to the coprocessor 12, the instruction execution unit 202 executes the instruction, that is, causes the operation group to perform processing based on the instruction.
  • the detection unit 203 detects the completion of processing in the coprocessor 12 when the debug mode determination unit 111 determines that the debug mode is set. Specifically, the detection unit 203 determines that the coprocessor 12 is executing processing while receiving a signal (for example, a busy signal) output from the coprocessor 12, and stops receiving the busy signal. It is determined that the processing is completed.
  • a signal for example, a busy signal
  • Register file 106 is a register group that holds data to be read and written by executing the instruction stream held in the instruction buffer 104.
  • the computing unit group 107 is a processing unit including a plurality of computing units 107a, 107b, and 107c such as an adder and a multiplier, and also includes a memory access unit 108 as shown in FIG.
  • the memory access unit 108 is an arithmetic unit for executing an instruction to access the data memory 109.
  • the write back bus 110 is a bus for writing back the output from the arithmetic unit group 107 to the register file 106.
  • Data memory 109 The data memory 109 is accessed by an instruction for accessing the memory, and holds data when the program is executed.
  • the coprocessor 12 includes an instruction processing unit 121, a register file 122, a calculator group 123, a data memory 125, and a write back bus 126.
  • Instruction processing unit 121 activates and executes the coprocessor instruction stream by receiving the activation instruction from the issued instruction determination unit 105.
  • the instruction processing unit 121 stores a plurality of coprocessor instruction streams that are independent from the instruction stream of the main processor 11, and the activation instruction from the main processor 11 specifies which instruction stream is to be executed. Is included. For example, if the activation instruction has 3-bit designation information, one of eight types of coprocessor instruction streams can be designated.
  • the instruction processing unit 121 outputs a busy signal to the issued instruction determination unit 105 of the main processor 11 during execution of the activated coprocessor instruction stream.
  • a busy signal to the issued instruction determination unit 105 of the main processor 11 during execution of the activated coprocessor instruction stream.
  • the coprocessor instruction stream includes an instruction indicating the end of the instruction stream, and when the instruction indicating the end is reached as a result of sequential execution, it is treated as completion of the coprocessor process.
  • Register file 122 is a group of registers that hold data to be read and written by executing a coprocessor instruction stream.
  • the computing unit group 123 is a processing unit including a plurality of computing units such as an adder and a multiplier used by a coprocessor instruction stream.
  • the computing unit group 123 also has a memory access unit 124 as shown in FIG.
  • the memory access unit 124 is an arithmetic unit for executing an instruction to access the data memory.
  • the write back bus 126 is a bus for writing back the output from the arithmetic unit group 123 to the register file 122.
  • Data memory 125 The data memory 125 is accessed by an instruction for accessing the memory, and holds data when the program is executed.
  • the process for determining an instruction to be issued in a certain cycle is an operation for determining an instruction to be executed by passing the instruction stored in the instruction buffer 104 to the arithmetic unit group 107.
  • the instruction specifying unit 201 confirms whether there is an issueable instruction in the instruction buffer 104 (step S5).
  • a valid signal is given to the issueable instruction in the instruction buffer 104.
  • the case where the instruction to which the valid signal is added does not exist is mainly the case where the instruction supply is not in time due to factors such as branching and memory access latency. Further, there may be a case where a valid signal is not given because an instruction is supplied but data dependency with a preceding instruction is not solved.
  • step S10 the instruction specifying unit 201 confirms whether the debug mode is set. Whether or not the debug mode is set is determined based on the determination result by the debug mode determination unit 111.
  • step S10 If it is determined that the debug mode is set (“Yes” in step S10), the detection unit 203 checks whether the coprocessor is being executed (step S15). Whether or not the coprocessor is being executed is determined based on whether or not a busy signal output from the instruction processing unit 121 is received.
  • step S15 If the coprocessor is being executed (“Yes” in step S15), the instruction specifying unit 201 determines that no instruction is issued in the cycle (step S20), and the process returns to step S5.
  • step S5 If there is no instruction to which a valid signal is given in the instruction buffer 104 (“No” in step S5), the operation of the instruction specifying unit 201 transitions to step S20.
  • step S10 When it is determined that the debug mode is not set (“No” in step S10) and when it is determined that the coprocessor is not being executed (“No” in step S15), the instruction specifying unit 201 determines the instruction of the cycle. It is determined that there is an issue (step S25), and the process returns to step S5.
  • the coprocessor 12 In the normal mode, while the main processor 11 is executing an instruction stream instruction (t5), the coprocessor 12 is notified based on the processing request instruction (t10). When the coprocessor 12 receives the notification, the operation is started (t15). At the same time, in the main processor 11, since there is no dependency between the coprocessor process and the main processor process in the normal mode, the subsequent process is continuously executed (t20).
  • the coprocessor 12 When the debug mode is set, while the main processor 11 is executing an instruction stream instruction (t50), the coprocessor 12 is notified based on the processing request instruction (t55). When the coprocessor 12 receives the notification, the operation is started (t60). At this time, the coprocessor 12 outputs a busy signal to the main processor 11 while the operation is being performed at t60. The main processor 11 does not execute processing while receiving a busy signal. Thereafter, when the operation is completed in the coprocessor 12, the output of the busy signal is stopped (t65). When the main processor 11 detects the completion of the operation of the coprocessor 12, the main processor 11 resumes the processing (t70).
  • the main processor 11 when the debug mode is set, when the coprocessor process is started, the main processor 11 does not execute the subsequent process, and the exclusive operation is guaranteed during the period during which the coprocessor is operating. Is done.
  • the operation using the instruction unit parallelism in the main processor 11 in the debug mode and the operation using the instruction unit parallelism in the coprocessor 12 are finally performed by the programmer. It is almost equivalent to the intended one (non-debug mode operation).
  • the multiprocessor system 10 shown in the present embodiment performs exclusive execution with execution of the main processor 11, which executes instructions in the coprocessor 12 in parallel with the main processor 11 based on the setting of the debug mode. Can be switched.
  • FIG. 5 is a block diagram illustrating a configuration of a multiprocessor system 1000 according to the second embodiment.
  • the multiprocessor system 1000 has a function in the second debug mode in addition to the function in the debug mode (hereinafter referred to as “first debug mode”) shown in the first embodiment.
  • the multiprocessor system 1000 includes a main processor 1001 and a coprocessor 1002 as shown in FIG.
  • the main processor 1001 and the coprocessor 1002 perform processing in parallel as in the first embodiment.
  • the first debug mode is set, parallel processing is not performed.
  • the second debug mode is set, the main processor 1001 and the coprocessor 1002 perform parallel processing, but the coprocessor 1002 performs processing based on different instruction streams, that is, notifications of different processing requests. Does not process in parallel.
  • the main processor 1001 includes an instruction memory 101, an instruction fetch control unit 102, an instruction group determination unit 103, an instruction buffer 104, an issued instruction determination unit 1105, a register file 106, an operation.
  • the device group 107, the data memory 109, the write-back bus 110, and the debug mode determination unit 1111 are configured.
  • Debug mode determination unit 1111 determines whether or not the debug mode is set. When the debug mode is set, it is determined whether the first debug mode or the second debug mode is set.
  • the debug mode determination unit 111 holds a debug mode designation register, and whether the first debug mode is set or the second debug mode is set according to the value of the debug mode specification register, It is discriminated whether it is not set, and the result is notified to the issuance instruction determination unit 105.
  • the debug mode designation register is a control register set by software.
  • Issued instruction determination unit 1105 determines an instruction to be issued for each machine cycle from the instruction buffer 104, and executes an instruction in the main processor 1001 and requests a process to the coprocessor 1002 according to the determined instruction.
  • the issue command determination unit 1105 includes a command specification unit 1201, a command execution unit 1202, and a detection unit 1203, as shown in FIG.
  • the instruction specifying unit 1201 specifies an instruction to be issued from the instruction buffer 104 for each machine cycle.
  • the instruction specifying unit 1201 performs the same operation as that of the first embodiment when the debug mode determining unit 1111 determines that the first debug mode is set.
  • the instruction specifying unit 1201 determines that the instruction to be issued next is a processing request instruction to the coprocessor, and the coprocessor 1002 Is being executed, the specification of the instruction to be issued is stopped, and the specification of the instruction is resumed when the processing of the coprocessor 12 is completed.
  • the instruction execution unit 1202 notifies the activation instruction to the coprocessor 1002 when the instruction specified by the instruction specifying unit 1201 is a processing request instruction to the coprocessor 12.
  • the instruction execution unit 202 executes the instruction, that is, causes the operation group to perform processing based on the instruction.
  • the detection unit 1203 detects completion of processing in the coprocessor 12 when the debug mode determination unit 111 determines that the first debug mode is set or the second debug mode is set. It is. Specifically, the detection unit 203 determines that the coprocessor 12 is executing processing while receiving a signal (for example, a busy signal) output from the coprocessor 12, and stops receiving the busy signal. It is determined that the processing is completed.
  • a signal for example, a busy signal
  • the process for determining an instruction to be issued in a certain cycle is an operation for determining an instruction to be executed by passing the instruction stored in the instruction buffer 104 to the arithmetic unit group 107.
  • the instruction specifying unit 1201 confirms whether there is an issueable instruction in the instruction buffer 104 (step S100).
  • a valid signal is given to the issueable instruction in the instruction buffer 104.
  • the case where the instruction to which the valid signal is added does not exist is mainly the case where the instruction supply is not in time due to factors such as branching and memory access latency. Further, there may be a case where a valid signal is not given because an instruction is supplied but data dependency with a preceding instruction is not solved.
  • step S100 If there is an instruction to which a valid signal is given in the instruction buffer 104 (“Yes” in step S100), the instruction specifying unit 1201 checks whether the first debug mode is set (step S105). Whether or not the first debug mode is set is determined based on the determination result by the debug mode determination unit 1111.
  • step S105 If it is determined that the first debug mode is set (“Yes” in step S105), the detection unit 1203 checks whether the coprocessor is being executed (step S110). Whether or not the coprocessor is being executed is determined based on whether or not a busy signal output from the instruction processing unit 121 is received.
  • step S110 If the coprocessor is being executed (“Yes” in step S110), the instruction specifying unit 1201 determines that no instruction is issued in the cycle (step S130), and the process returns to step S100.
  • step S110 If it is determined that the coprocessor is not executing (“No” in step S110), the instruction identifying unit 1201 determines that there is an instruction issued in the cycle (step S135), and the process returns to step S100.
  • step S100 When there is no instruction to which a valid signal is given in the instruction buffer 104 (“No” in step S100), the operation of the instruction specifying unit 1201 transitions to step S135.
  • the instruction specifying unit 1201 determines whether the second debug mode is set (step S120). Whether or not the second debug mode is set is determined based on the determination result by the debug mode determination unit 1111.
  • the instruction specifying unit 1201 determines whether the instruction to be issued is a processing request instruction to the coprocessor 1002. (Step S120).
  • the detection unit 1203 confirms whether the coprocessor is being executed. (Step S125). Whether or not the coprocessor is being executed is determined based on whether or not a busy signal output from the instruction processing unit 121 is received.
  • step S125 If the coprocessor is being executed (“Yes” in step S125), the instruction specifying unit 1201 determines that no instruction is issued in the cycle (step S130), and the process returns to step S100.
  • step S125 If it is determined that the coprocessor is not being executed (“No” in step S125), the instruction specifying unit 1201 determines that there is an instruction issued in the cycle (step S135), and the process returns to step S100.
  • the coprocessor 1002 is notified based on the processing request instruction (t1055). In this case, since the coprocessor 1002 is not executed, notification is made.
  • the operation is started (t110).
  • the coprocessor 1002 outputs a busy signal to the main processor 1001 while the operation is being performed at t110.
  • the main processor 1001 continues the process if the command to be issued is not a processing request command (t115).
  • the main processor 1001 does not execute processing while the command to be issued is a processing request command and a busy signal is received (t120). Thereafter, when the operation is completed in the coprocessor 1002, the output of the busy signal is stopped (t125).
  • the main processor 1001 detects the completion of the operation of the coprocessor 12, it resumes processing, that is, issues a processing request command (t130).
  • the operation is started (t135).
  • the main processor 1001 even if the coprocessor 1002 is executing (t135), if the instruction to be issued is not a processing request instruction, the processing is continued (t140).
  • a multiprocessor system 1501 shown in FIG. 8 performs a system LSI video decoding process for digital AV equipment.
  • VLD variable bit length analysis
  • IQT inverse quantization and inverse frequency transformation
  • MC motion compensation
  • Recon image reconstruction
  • DPF deblock filter processing
  • inverse quantization and inverse frequency transform (IQT), motion compensation (MC), image reconstruction (Recon), and deblocking filter processing (DBF) (see processing group 1505) utilize data parallelism. Since processing is possible and suitable for coprocessor processing using a special arithmetic unit, by executing these processing as processing in the coprocessor 1503, high-performance decoding processing can be realized.
  • VLD variable length decoding process
  • a multiprocessor system 1601 shown in FIG. 9 performs a system LSI video encoding process for digital AV equipment.
  • the macroblock encoding process usually includes a motion estimation process for calculating a prediction error for image data to be encoded, a quantization process for performing frequency conversion and quantization on the prediction error, a quantized DCT coefficient, and a motion vector.
  • An encoding process for variable length encoding, a process for generating a reference image, and a process for motion compensation are included.
  • a motion estimation process for calculating a prediction error for image data to be encoded a quantization process for performing frequency conversion and quantization on the prediction error, a process for generating a reference image, and motion compensation (processing group 1605).
  • the main processor uses the busy signal output during execution of processing from the coprocessor to determine whether or not the coprocessor is executing processing.
  • the present invention is not limited to this.
  • the coprocessor When the execution of the activated coprocessor instruction stream is completed, the coprocessor notifies the issue instruction determination unit 105 that the coprocessor processing has been completed, and the main processor receives the notification, and the main processor receives the notification. Completion of processing by the processor may be detected.
  • Completion of memory access by a coprocessor may be regarded as completion of processing of the coprocessor. For example, if a memory access is made to the data memory using memory access within the coprocessor instruction stream, completion of the read or write access to the memory may be delayed with respect to instruction execution within the processor. . In such a case, by setting the completion of the memory access as the completion of the coprocessor process, for example, it is possible to detect a defect due to an unintended memory access address match.
  • the main processor instruction following the coprocessor activation instruction may not be issued simultaneously with the coprocessor activation instruction even in the non-debug mode operation.
  • the operation using the instruction unit parallelism in the main processor in the debug mode and the operation using the instruction unit parallelism in the coprocessor are finally intended by the programmer (non-debug mode operation). And can be matched perfectly.
  • the multiprocessor system 1000 may allow out-of-order execution.
  • a CPU Central Processing Unit
  • a program describing the procedure of the method may be stored in a recording medium and distributed.
  • Each component of the multiprocessor system in the above embodiment is realized by hardware resources (cooperation between a processor and a program on a memory).
  • the first processor Determining means for determining whether or not a mode is set; specifying means for sequentially specifying instructions to be executed from the instruction sequence; and if the specified instruction is a processing request instruction, the second processor And a detection unit that detects that the second processor has completed the process according to the notification, and an execution unit that executes the specified instruction if the instruction is not a process request instruction. And when the determination unit determines that the debug mode is set, the specifying unit specifies a processing request instruction and thereafter The specification of the instruction is stopped, and the specification of the instruction is resumed when the completion is detected.
  • the multiprocessor system determines that the debug mode is set by the determination unit, when the processing request instruction is specified, the subsequent instruction specification is stopped and the completion is detected. Resume instruction identification. Thereby, the multiprocessor stops specifying the subsequent instructions after specifying the processing request instruction, so that the instruction processed by the second processor and the instructions after specifying the processing request instruction are not issued in parallel. So you can debug efficiently.
  • the second processor While the second processor is executing the process according to the notification, the second processor outputs a signal indicating that the process is being executed to the first processor, and the detection means While the signal is output from the processor, the second processor determines that the process corresponding to the notification is being executed, and determines that the process corresponding to the notification is completed when the signal is not output. You may do that.
  • the first processor can detect completion of the operation of the second processor based on the presence or absence of a signal output from the second processor.
  • completion of the processing according to the notification means that the memory access of all the memory access instructions included in the instruction flow for the second processor to execute the processing according to the notification is completed. It may be that.
  • the multiprocessor system since the multiprocessor system sets the completion of the memory access as the completion of the second processor process, for example, it is possible to detect a failure due to an unintended memory access address match.
  • the determination means further determines whether or not a debug mode different from the debug mode is set instead of the debug mode, and the determination means sets the another debug mode. If it is determined that the processing request command has been specified, the execution unit determines whether the execution unit is requested to process the second processor before the completion is detected by the detection unit. An instruction that exists before the appearance of the instruction is executed, or an instruction that exists before the appearance of the next processing request instruction and an instruction that is located after the next processing request instruction and does not depend on the next processing request instruction When the completion is detected by the detection means, a notification based on the next processing request command may be sent to the second processor.
  • the multiprocessor system when another debug mode is set, the multiprocessor system does not perform processing for notifications based on different processing request instructions in parallel in the second processor. Thereby, before executing parallel processing for notifications based on different processing request instructions in the second processor, the parallel processing of the first processor and the second processor is debugged, thereby efficiently eliminating the problem. be able to.
  • Control means may be provided for controlling to resume the specification of the instruction when the completion is detected.
  • the multiprocessor system stops specifying the subsequent instruction when the processing request instruction is specified, and resumes specifying the instruction when the completion is detected. Accordingly, the operation using the instruction unit parallelism in the main processor in the debug mode and the operation using the instruction unit parallelism in the coprocessor can be completely matched with the operation in the non-debug mode.
  • an instruction executed by each of the first processor and the second processor is for performing an image decoding process
  • the multiprocessor system is an image processing apparatus for performing an image decoding process. May be provided.
  • the multiprocessor system can efficiently debug the decoding process.
  • an instruction executed by each of the first processor and the second processor is for performing an image encoding process
  • the multiprocessor system is an image processing apparatus for performing an image encoding process. May be provided.
  • the multiprocessor system can efficiently debug the encoding process.
  • the multiprocessor system according to the present invention has a function for realizing flexible and high-performance arithmetic processing, it can be applied to a system LSI that performs media processing of video and audio such as a DVD recorder and a digital TV.

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Hardware Design (AREA)
  • Quality & Reliability (AREA)
  • Debugging And Monitoring (AREA)
  • Advance Control (AREA)

Abstract

 一のプロセッサの動作と他のプロセッサの動作とについて、効率的にデバッグできるマルチプロセッサシステムを提供する。第1プロセッサと、当該第1プロセッサからの通知を受けて処理を実行する第2プロセッサとを有するマルチプロセッサシステムにおいて、前記第1プロセッサは、命令列中から実行対象となる命令を逐次特定し、特定した命令が処理依頼命令である場合には前記第2プロセッサに対して当該処理依頼に基づく通知を行い、処理依頼命令でない場合には当該命令を実行するともに、デバッグモードが設定されているか否かを判別し、デバッグモードが設定されていると判断する場合に処理依頼命令を特定すると以降の命令の特定は停止し、前記通知をした後、前記第2プロセッサが前記通知に応じた処理を完了したことを検知すると命令の特定を再開する。

Description

マルチプロセッサシステム
 本発明は、メインプロセッサとコプロセッサを備えるマルチプロセッサシステムにおいて、ソフトウェアデバッグ効率を向上させる技術に関する。
 デジタル化された映像データや、音声データなどの圧縮、伸張等を行うメディア処理は非常に演算量が大きい。このため、メディア処理を行うための専用ハードウェアや高性能なDSP(Digital Signal Processor)などが普及している。
 このようなメディア処理について、MPEG(Moving Picture Experts Group)-2、MPEG-4、H.263、H.264等、非常に多数の規格が実用化されている。このため、デジタルAV(Audio-Visual)機器は、複数の規格のメディア処理に対応することが要求されている。さらに、各メディア処理アプリケーションの複雑度は上昇しており、画像サイズ、音声のチャネル数等も増加する傾向にあり、演算量は増大の一歩をたどっている。
 そこで、特定の演算に特化したコプロセッサを備えることにより演算効率を大幅に向上させた、高性能なプロセッサを用いることにより、性能向上を図っている。
 コプロセッサを備えるマルチプロセッサシステムでは、メインプロセッサでの処理とコプロセッサでの処理間で、ソフトウェア上のデータ依存性及び、使用するハードウェアリソースに競合が無い場合、それらの処理を同時に実行することにより、より性能向上を図ることが可能である。
 例えば、特許文献1には、実行モードを設定することによって、メインプロセッサとコプロセッサ(FPU:Floating Point number processing Unit)それぞれの命令実行動作が変化する構成が開示されている。この特許文献1によると、メインプロセッサとコプロセッサ(FPU)の命令実行モード(シリアル・スカラ)を統一させ、浮動小数点命令(コプロセッサに相当)の実行時に、メインプロセッサの命令実行モードをコプロセッサ(FPU)側にあわせるという制御を行っている。これにより、メインプロセッサとコプロセッサとの処理を同時に行うことができる。
特開平7-319694号公報
 しかしながら、上述の技術では、メインプロセッサ側の命令実行モードがコプロセッサ側の動作に同期させることで、動作を単純化し性能を向上させることができるが、その反面、メインプロセッサ及びコプロセッサについてのソフトウェアデバッグ効率が下がってしまうという問題がある。
 そこで、本発明は、一のプロセッサの動作と他のプロセッサの動作とについて、効率的にデバッグできるマルチプロセッサシステム及び方法を提供することを目的とする。
 上記目的を達成するために、本発明は、第1プロセッサと、当該第1プロセッサからの通知を受けて処理を実行する第2プロセッサとを有するマルチプロセッサシステムであって、前記第1プロセッサは、デバッグモードが設定されているか否かを判別する判別手段と、命令列中から実行対象となる命令を逐次特定する特定手段と、特定された命令が、処理依頼命令である場合には前記第2プロセッサに対して当該処理依頼に基づく通知を行い、処理依頼命令でない場合には当該特定された命令を実行する実行手段と、前記第2プロセッサが前記通知に応じた処理を完了したことを検知する検知手段とを備え、前記特定手段は、前記判別手段でデバッグモードが設定されていると判別される場合において、処理依頼命令を特定すると以降の命令の特定は停止し、前記完了が検知されると命令の特定を再開することを特徴とする。
 上記構成によると、マルチプロセッサシステムは、前記判別手段でデバッグモードが設定されていると判別される場合において、処理依頼命令を特定すると以降の命令の特定は停止し、前記完了が検知されると命令の特定を再開する。これにより、マルチプロセッサは、処理依頼命令を特定後において、以降の命令の特定を停止することで、第2プロセッサが処理する命令と、処理依頼命令の特定後以降の命令とは並列に発行されないので、効率的にデバッグすることができる。
マルチプロセッサシステム10の構成を示す図である。 発行命令決定処理を示す流れ図である。 通常モードの場合におけるメインプロセッサ11とコプロセッサ12との処理を説明する図である。 デバッグモードの場合におけるメインプロセッサ11とコプロセッサ12との処理を説明する図である。 マルチプロセッサシステム1000の構成を示す図である。 発行命令決定処理を示す流れ図である。 第2のデバッグモードの場合におけるメインプロセッサ1001とコプロセッサ1002との処理を説明する図である。 マルチプロセッサシステム10を用いたデコード処理を説明する図である。 マルチプロセッサシステム10を用いたエンコード処理を説明する図である。
 (本発明の基礎となった知見)
 上記特許文献1で開示された技術は、上述したように、メインプロセッサ側の命令実行モードがコプロセッサ側の動作に同期させることで、動作を単純化し性能を向上させることができる。
 しかしながら、上記特許文献1で開示された技術では、メインプロセッサ及びコプロセッサについてのソフトウェアデバッグ効率が下がってしまう。例えば、コプロセッサ側のソフトウェアが、メインプロセッサが使用するメモリ領域の一部分を誤って破壊してしまっていた場合、同時にメインプロセッサとコプロセッサとが並列に実行していることで障害原因となるプログラムの切り分けが困難となる。そのため、その不具合は、ソフトウェアのうちメインプロセッサが実行している命令列による不具合なのか、コプロセッサが実行している命令列による不具合なのか、つまりはメインプロセッサ側のソフトウェアが持つソフトウェア不具合なのか、コプロセッサ側のソフトウェアが持つソフトウェア不具合なのかが不明となってしまう。
 そこで、発明者が鋭意検討し、一のプロセッサの動作と他のプロセッサの動作とについて、効率的にデバッグできるマルチプロセッサシステムを見出し、発明に至った。
 本発明の一態様である、第1プロセッサと、当該第1プロセッサからの通知を受けて処理を実行する第2プロセッサとを有するマルチプロセッサシステムは、前記第1プロセッサは、デバッグモードが設定されているか否かを判別する判別手段と、命令列中から実行対象となる命令を逐次特定する特定手段と、特定された命令が、処理依頼命令である場合には前記第2プロセッサに対して当該処理依頼に基づく通知を行い、処理依頼命令でない場合には当該特定された命令を実行する実行手段と、前記第2プロセッサが前記通知に応じた処理を完了したことを検知する検知手段とを備え、前記特定手段は、前記判別手段でデバッグモードが設定されていると判別される場合において、処理依頼命令を特定すると以降の命令の特定は停止し、前記完了が検知されると命令の特定を再開することを特徴とする。
 1.第1の実施の形態
 以下、本発明に係る第1の実施の形態について、図面を参照しながら説明する。
 1.1 構成
 図1は、第1の実施の形態におけるマルチプロセッサシステム10の構成を示すブロック図である。
 マルチプロセッサシステム10は、図1に示すように、メインプロセッサ11とコプロセッサ12とから構成されている。マルチプロセッサシステム10において、デバッグモードが設定されていない状態、つまり通常モードの状態である場合には、メインプロセッサ11とコプロセッサ12とは、並列に処理を行う。デバッグモードが設定されている場合には、並列処理は行わない。
 (1)メインプロセッサ11について
 メインプロセッサ11は、図1に示すように、命令メモリ101、命令フェッチ制御部102、命令群決定部103、命令バッファ104、発行命令決定部105、レジスタファイル106、演算器群107、データメモリ109、ライトバックバス110、及びデバッグモード判別部111から構成されている。
 (1-1)命令メモリ101
 命令メモリ101は、メインプロセッサ11において実行される命令を保持するメモリであり、複数の命令の組み合わせからなる命令流を保持している。
 (1-2)命令フェッチ制御部102
 命令フェッチ制御部102は、プログラムカウンタ(PC)を保持し、次に実行する命令を命令メモリから読み出すとともに、プログラムカウンタ値を次読み出し命令の値に更新する。
 また、命令フェッチ制御部102は、演算器群107から、分岐命令実行や、及び例外発生に相当する特殊処理ベクタへの分岐処理要求を受け取り、読み出しプログラムカウンタの制御を行う。
 (1-3)命令群決定部103
 命令群決定部103は、命令メモリ101から、命令流に属する命令を読み出し、デコードを行い、命令バッファ104に書き込む。
 (1-4)命令バッファ104
 命令バッファ104は、命令流に属する命令を受け取り、保持するものである。
 (1-5)デバッグモード判別部111
 デバッグモード判別部111は、デバッグモードが設定されているか否かを判別するものである。
 具体的には、デバッグモード判別部111は、デバッグモード指定レジスタを保持し、その値によってデバッグモードか否かを判別し、その結果を発行命令決定部105へ通知する。ここで、デバッグモード指定レジスタは、ソフトウェアによって設定される制御レジスタである。
 (1-6)発行命令決定部105
 発行命令決定部105は、命令バッファ104からマシンサイクル毎に発行すべき命令を決定し、決定した命令に応じて、メインプロセッサ11内で命令の実行及びコプロセッサ12へ処理依頼を行う。
 発行命令決定部105は、図1に示すように、命令特定部201、命令実行部202及び検知部203を有している。
 命令特定部201は、命令バッファ104からマシンサイクル毎に発行すべき命令を特定するものである。命令特定部201は、デバッグモード判別部111でデバッグモードが設定されていると判断する場合において、コプロセッサ12が処理実行中であるときには、発行すべき命令の特定を中止し、コプロセッサ12の処理が完了すると命令の特定を再開する。
 命令実行部202は、命令特定部201で特定された命令がコプロセッサ12への処理依頼命令である場合にはコプロセッサ12に対して当該処理依頼に基づく通知(以降、起動命令という。)を行う。また、命令実行部202は、特定された命令がコプロセッサ12への処理依頼命令以外の命令である場合には当該命令の実行、つまり演算群に対して当該命令に基づく処理を行わせる。
 検知部203は、デバッグモード判別部111でデバッグモードが設定されていると判断する場合において、コプロセッサ12での処理完了を検知するものである。具体的には、検知部203は、コプロセッサ12から出力される信号(例えば、ビジー信号)を受信している間はコプロセッサ12は処理実行中であると判断し、ビジー信号を受信しなくなると、処理が完了したと判断する。
 (1-7)レジスタファイル106
 レジスタファイル106は、命令バッファ104に保持された命令流を実行することによって、読み出し及び書き込みの対象とされるデータを保持するレジスタ群である。
 (1-8)演算器群107
 演算器群107は、加算器や乗算器などの複数の演算器107a、107b、107cを含む処理部であり、図1に示すように、メモリアクセス部108をも有している。
 ここで、メモリアクセス部108は、データメモリ109とアクセスする命令を実行するための演算器である。
 (1-9)ライトバックバス110
 ライトバックバス110は、演算器群107からの出力をレジスタファイル106に書き戻すためのバスである。
 (1-10)データメモリ109
 データメモリ109は、当該メモリとアクセスする命令によってアクセスされ、プログラムを実行する際のデータを保持している。
 (2)コプロセッサ12について
 コプロセッサ12は、図1に示すように、命令処理部121、レジスタファイル122、演算器群123、データメモリ125と、ライトバックバス126とから構成されている。
 (2-1)命令処理部121
 命令処理部121は、発行命令決定部105から、起動命令を受け取ることによって、コプロセッサ命令流を起動し、実行する。
 命令処理部121は、メインプロセッサ11の命令流とは独立した、複数のコプロセッサ命令流を記憶しており、メインプロセッサ11からの起動命令は、いずれの命令流を実行するかを指定する情報を含んでいる。例えば、起動命令の中に、3ビットの指定情報を持った場合、8種類のコプロセッサ命令流の中から1つを指定することができる。
 命令処理部121は、起動されたコプロセッサ命令流の実行中は、メインプロセッサ11の発行命令決定部105に対してビジー信号を出力する。起動されたコプロセッサ命令流の実行が完了すると、ビジー信号の出力を停止する。ここで、コプロセッサ命令流には、命令流の終端を示す命令が含まれており、順次実行した結果、終端を示す命令に達するとコプロセッサ処理の完了として扱う。
 (2-2)レジスタファイル122
 レジスタファイル122は、コプロセッサ命令流を実行することによって、読み出し及び書き込みの対象とされるデータを保持するレジスタ群である。
 (2-3)演算器群123
 演算器群123は、コプロセッサ命令流によって用いられる加算器や乗算器などの複数の演算器を含む処理部である。
 また、演算器群123は、図1に示すように、メモリアクセス部124をも有している。ここで、メモリアクセス部124は、データメモリとアクセスする命令を実行するための演算器である。
 (2-4)ライトバックバス126
 ライトバックバス126は、演算器群123からの出力をレジスタファイル122に書き戻すためのバスである。
 (2-5)データメモリ125
 データメモリ125は、当該メモリとアクセスする命令によってアクセスされ、プログラムを実行する際のデータを保持している。
 1.2 動作
 ここでは、発行命令決定部105があるサイクルに発行する命令を確定する処理について、図2に示す流れ図を用いて説明する。あるサイクルに発行する命令を確定する処理とは、命令バッファ104内に蓄積された命令の中から、演算器群107に渡すことによって実行する命令を確定させる動作である。
 命令特定部201は、命令バッファ104内に、発行可能な命令が存在するかを確認する(ステップS5)。ここで、発行可能な命令には、命令バッファ104内で、バリッド信号が付与されている。バリッド信号が付与された命令が存在しないケースは、分岐やメモリアクセスレイテンシ等の要因で、命令供給が間に合っていないケースが主である。また、命令は供給されているが、先行命令とのデータ依存が解決されていないためにバリッド信号が付与されていないケースも考えられる。
 命令バッファ104にバリッド信号が付与された命令が存在する場合(ステップS5における「Yes」)は、命令特定部201は、デバッグモード設定がされているかどうかを確認する(ステップS10)。デバッグモードが設定されているか否かは、デバッグモード判別部111による判別結果に基づいて行われる。
 デバッグモードが設定されていると判断する場合(ステップS10における「Yes」)、検知部203がコプロセッサが実行中であるかどうかを確認する(ステップS15)。 コプロセッサが実行中かどうかは、命令処理部121から出力されるビジー信号の受信の有無に基づいて行われる。
 コプロセッサが実行中である場合(ステップS15における「Yes」)は、命令特定部201は、当該サイクルの命令発行無し、と決定し(ステップS20)、処理はステップS5へ戻る。
 命令バッファ104にバリッド信号が付与された命令が存在しない場合(ステップS5における「No」)、命令特定部201の動作は、ステップS20に遷移する。
 デバッグモード設定がなされていないと判断する場合(ステップS10における「No」)、及びコプロセッサが実行中でないと判断する場合(ステップS15における「No」)、命令特定部201は、当該サイクルの命令発行有りと決定し(ステップS25)、処理は、ステップS5へ戻る。
 1.3 具体例
 ここでは、通常モードの場合と、デバッグモードが設定されている場合とについて、メインプロセッサ11及びコプロセッサ12の処理について説明する。
 まず通常モードの場合について図3を用いて説明する。
 通常モードの場合には、メインプロセッサ11が命令流の命令を実行中において(t5)、処理依頼命令に基づいてコプロセッサ12へ通知を行う(t10)。コプロセッサ12では、通知を受け取ると、動作が起動される(t15)。また、同時にメインプロセッサ11では、通常モード時にはコプロセッサ処理とメインプロセッサ処理に依存関係が無いので、後続の処理を続けて実行する(t20)。
 次にデバッグモード時について図4を用いて説明する。
 デバッグモードが設定されている場合、メインプロセッサ11が命令流の命令を実行中において(t50)、処理依頼命令に基づいてコプロセッサ12へ通知を行う(t55)。コプロセッサ12では、通知を受け取ると、動作が起動される(t60)。このとき、コプロセッサ12はt60において動作がなされている間は、メインプロセッサ11に対してビジー信号を出力する。メインプロセッサ11においては、ビジー信号を受け取っている間は、処理は実行しない。その後、コプロセッサ12において動作が完了するとビジー信号の出力を中止する(t65)。メインプロセッサ11は、コプロセッサ12の動作完了を検知すると、処理を再開する(t70)。
 これにより、デバッグモードが設定されている場合には、コプロセッサの処理が開始されると、メインプロセッサ11においては、後続の処理は実行されず、コプロセッサが動作中の期間は排他動作が保証される。また、一連の動作の中で、デバッグモード時におけるメインプロセッサ11内の命令単位の並列性を用いた動作と、コプロセッサ12内の命令単位の並列性を用いた動作は、プログラマが最終的に意図したもの(非デバッグモード動作)とほぼ同等である。
 1.4 まとめ
 以上により、本実施の形態で示すマルチプロセッサシステム10は、デバッグモードの設定に基づいて、コプロセッサ12における命令の実行をメインプロセッサ11と並列に行う、メインプロセッサ11の実行と排他にするという切り替えを行うことができる。
 本実施の形態により、高性能なコプロセッサつきのプロセッサにおけるデバッグ時の要因切り分けを、ソフトウェアの改変無しに、容易に行うことができる。
 2.第2の実施の形態
 以下、本発明に係る第2の実施の形態について、図面を参照しながら説明する。
 2.1 構成
 図5は、第2の実施の形態におけるマルチプロセッサシステム1000の構成を示すブロック図である。
 マルチプロセッサシステム1000は、第1の実施の形態で示すデバッグモード(以下、「第1のデバッグモード」という。)での機能に加えて、第2のデバッグモードの機能を有している。
 以下においては、第2のデバッグモードについての機能説明を行う。また、第1の実施の形態で示す機能要素と同一の機能要素については、同じ符号を付する。
 マルチプロセッサシステム1000は、図5に示すように、メインプロセッサ1001とコプロセッサ1002とから構成されている。マルチプロセッサシステム1000において、デバッグモードが設定されていない状態、つまり通常モードの状態である場合には、第1の実施の形態と同様にメインプロセッサ1001とコプロセッサ1002とは、並列に処理を行う。第1のデバッグモードが設定されている場合には、並列処理は行わない。また、第2のデバッグモードが設定されている場合には、メインプロセッサ1001とコプロセッサ1002とは並列処理を行うが、コプロセッサ1002において、異なる命令流、つまり異なる処理依頼の通知に基づく処理については、並列に処理をしない。
 (1)メインプロセッサ1001について
 メインプロセッサ1001は、図5に示すように、命令メモリ101、命令フェッチ制御部102、命令群決定部103、命令バッファ104、発行命令決定部1105、レジスタファイル106、演算器群107、データメモリ109、ライトバックバス110、及びデバッグモード判別部1111から構成されている。
 以下、発行命令決定部1105及びデバッグモード判別部1111の機能について説明する。
 (1-1)デバッグモード判別部1111
 デバッグモード判別部1111は、デバッグモードが設定されているか否かを判別するものである。また、デバッグモードが設定されている場合には、第1デバッグモードであるか第2のデバッグモードであるかを判別する。
 具体的には、デバッグモード判別部111は、デバッグモード指定レジスタを保持し、その値により第1のデバッグモードが設定されているか、第2のデバッグモードが設定されているか、何れのデバッグモードも設定されていないのかを判別し、その結果を発行命令決定部105へ通知する。ここで、デバッグモード指定レジスタは、ソフトウェアによって設定される制御レジスタである。
 (1-2)発行命令決定部1105
 発行命令決定部1105は、命令バッファ104からマシンサイクル毎に発行すべき命令を決定し、決定した命令に応じて、メインプロセッサ1001内で命令の実行及びコプロセッサ1002へ処理依頼を行う。
 発行命令決定部1105は、図5に示すように、命令特定部1201、命令実行部1202及び検知部1203を有している。
 命令特定部1201は、命令バッファ104からマシンサイクル毎に発行すべき命令を特定するものである。命令特定部1201は、デバッグモード判別部1111で第1のデバッグモードが設定されていると判断する場合においては、上記第1の実施の形態と同様の動作を行う。
 デバッグモード判別部1111で第2のデバッグモードが設定されていると判断する場合には、命令特定部1201は、次に発行すべき命令がコプロセッサへの処理依頼命令であって、コプロセッサ1002が処理実行中であるときには、発行すべき命令の特定を中止し、コプロセッサ12の処理が完了すると命令の特定を再開する。
 命令実行部1202は、命令特定部1201で特定された命令がコプロセッサ12への処理依頼命令である場合にはコプロセッサ1002に対して起動命令の通知を行う。また、命令実行部202は、特定された命令がコプロセッサ12への処理依頼命令以外の命令である場合には当該命令の実行、つまり演算群に対して当該命令に基づく処理を行わせる。
 検知部1203は、デバッグモード判別部111で第1のデバッグモードが設定されている、又は第2のデバッグモードが設定されていると判断する場合において、コプロセッサ12での処理完了を検知するものである。具体的には、検知部203は、コプロセッサ12から出力される信号(例えば、ビジー信号)を受信している間はコプロセッサ12は処理実行中であると判断し、ビジー信号を受信しなくなると、処理が完了したと判断する。
 2.2 動作
 ここでは、発行命令決定部1105があるサイクルに発行する命令を確定する処理について、図6に示す流れ図を用いて説明する。あるサイクルに発行する命令を確定する処理とは、命令バッファ104内に蓄積された命令の中から、演算器群107に渡すことによって実行する命令を確定させる動作である。
 命令特定部1201は、命令バッファ104内に、発行可能な命令が存在するかを確認する(ステップS100)。ここで、発行可能な命令には、命令バッファ104内で、バリッド信号が付与されている。バリッド信号が付与された命令が存在しないケースは、分岐やメモリアクセスレイテンシ等の要因で、命令供給が間に合っていないケースが主である。また、命令は供給されているが、先行命令とのデータ依存が解決されていないためにバリッド信号が付与されていないケースも考えられる。
 命令バッファ104にバリッド信号が付与された命令が存在する場合(ステップS100における「Yes」)は、命令特定部1201は、第1のデバッグモード設定がされているかどうかを確認する(ステップS105)。第1のデバッグモードが設定されているか否かは、デバッグモード判別部1111による判別結果に基づいて行われる。
 第1のデバッグモードが設定されていると判断する場合(ステップS105における「Yes」)、検知部1203がコプロセッサが実行中であるかどうかを確認する(ステップS110)。 コプロセッサが実行中かどうかは、命令処理部121から出力されるビジー信号の受信の有無に基づいて行われる。
 コプロセッサが実行中である場合(ステップS110における「Yes」)は、命令特定部1201は、当該サイクルの命令発行無し、と決定し(ステップS130)、処理はステップS100へ戻る。
 コプロセッサが実行中でないと判断する場合(ステップS110における「No」)、命令特定部1201は、当該サイクルの命令発行有りと決定し(ステップS135)、処理は、ステップS100へ戻る。
 命令バッファ104にバリッド信号が付与された命令が存在しない場合(ステップS100における「No」)、命令特定部1201の動作は、ステップS135に遷移する。
 第1のデバッグモード設定がなされていないと判断する場合(ステップS105における「No」)、命令特定部1201は、第2のデバッグモードが設定されているか否かを判断する(ステップS120)。第2のデバッグモードが設定されているか否かは、デバッグモード判別部1111による判別結果に基づいて行われる。
 第2のデバッグモードが設定されていると判断する場合(ステップS115における「Yes」)、命令特定部1201は、発行すべき命令がコプロセッサ1002への処理依頼命令であるか否かを判断する(ステップS120)。
 命令特定部1201で発行すべき命令がコプロセッサ1002への処理依頼命令であると判断される場合(ステップS120における「Yes」)、検知部1203がコプロセッサが実行中であるかどうかを確認する(ステップS125)。 コプロセッサが実行中かどうかは、命令処理部121から出力されるビジー信号の受信の有無に基づいて行われる。
 コプロセッサが実行中である場合(ステップS125における「Yes」)は、命令特定部1201は、当該サイクルの命令発行無し、と決定し(ステップS130)、処理はステップS100へ戻る。
 コプロセッサが実行中でないと判断する場合(ステップS125における「No」)、命令特定部1201は、当該サイクルの命令発行有りと決定し(ステップS135)、処理は、ステップS100へ戻る。
 2.3 具体例
 ここでは、第2のデバッグモードが設定されている場合とについて、メインプロセッサ11及びコプロセッサ12の処理について、図7を用いて説明する。なお、通常モードの場合と、第1のデバッグモードが設定されている場合については、第1の実施の形態で示す図3、4と同様でるので、個々での説明は省略する。
 第2デバッグモードが設定されている場合、メインプロセッサ1001が命令流の命令を実行中において(t100)、処理依頼命令に基づいてコプロセッサ1002へ通知を行う(t1055)。この場合、コプロセッサ1002は実行されていないので、通知が行われる。
 コプロセッサ12では、通知を受け取ると、動作が起動される(t110)。このとき、コプロセッサ1002はt110において動作がなされている間は、メインプロセッサ1001に対してビジー信号を出力する。
 メインプロセッサ1001は、コプロセッサ1002が実行中(t110)であっても、発行すべき命令が処理依頼命令でない場合には、処理を続行する(t115)。そして、発行すべき命令が処理依頼命令であって、ビジー信号を受け取っている間は、メインプロセッサ1001は、処理を実行しない(t120)。その後、コプロセッサ1002において動作が完了するとビジー信号の出力を中止する(t125)。メインプロセッサ1001は、コプロセッサ12の動作完了を検知すると、処理を再開、つまり処理依頼命令を発行する(t130)。
 その後、コプロセッサ1002では、通知を受け取ると、動作が起動される(t135)。メインプロセッサ1001では、コプロセッサ1002が実行中(t135)であっても、発行すべき命令が処理依頼命令でない場合には、処理が続行される(t140)。
 3.第3の実施の形態
 ここでは、本発明に係る第3の実施の形態として、第1の実施の形態で示すマルチプロセッサを用いた適用例について説明する。
 図8に示すマルチプロセッサシステム1501は、デジタルAV機器向けのシステムLSI映像のデコード処理を行うものである。
 例えば、H.264等の規格を用いて圧縮された映像信号をデコードするためには、ビットストリームの解析・可変長符号化された信号の可変長復号処理(VLD)・逆量子化及び逆周波数変換(IQT)・動き補償(MC)・画像の再構成(Recon)・デブロックフィルタ処理(DBF)を行う必要がある。
 この中で逆量子化及び逆周波数変換(IQT)・動き補償(MC)・画像の再構成(Recon)・デブロックフィルタ処理(DBF)は(処理群1505を参照)、データ並列性を活用した処理が可能であり、特殊な演算器を用いたコプロセッサ処理に適しているため、これらの処理をコプロセッサ1503での処理として実行することにより、高性能なデコード処理を実現することができる。
 さらに、例えば、マクロブロック単位でパイプラインを組み、メインプロセッサ1502での可変長復号処理(VLD)処理1504と、コプロセッサでの処理群1505を並列に行うことによってさらに高性能化することができる。
 この場合に、第1の実施の形態で述べたデバッグモード機能を用いることによって、効率的なデバッグを実現することが可能となる。
 図9に示すマルチプロセッサシステム1601は、デジタルAV機器向けのシステムLSI映像のエンコード処理を行うものである。
 マクロブロックのエンコード処理には、通常、符号化対象の画像データに対する予測誤差を算出する動き推定処理、予測誤差に対して周波数変換及び量子化を行う量子化処理、量子化DCT係数及び動きベクトルを可変長符号化する符号化処理、参照画像の生成に係る処理、動き補償に係る処理が含まれる。
 この中で符号化対象の画像データに対する予測誤差を算出する動き推定処理、予測誤差に対して周波数変換及び量子化を行う量子化処理、参照画像の生成に係る処理、動き補償は(処理群1605を参照)、データ並列性を活用した処理が可能であり、特殊な演算器を用いたコプロセッサ処理に適しているため、これらの処理をコプロセッサ1603の処理として実行することにより、高性能なデコード処理を実現することができる。
 さらに、例えば、マクロブロック単位でパイプラインを組み、メインプロセッサ1602での量子化DCT係数及び動きベクトルを可変長符号化する符号化処理1604とコプロセッサ1603での処理群1605を並列に行うことによってさらに高性能化することができる。
 この場合に、第1の実施の形態で述べたデバッグモード機能を用いることによって、効率的なデバッグを実現することが可能となる。
 4.変形例
 以上、各実施の形態に基づいて説明したが、本発明は上記の各実施の形態に限られない。例えば、以下のような変形例が考えられる。
 (1)上記各実施の形態において、メインプロセッサは、コプロセッサが処理実行中か否かの判断に、コプロセッサから処理実行中に出力されるビジー信号を用いたが、これに限定されない。
 コプロセッサは起動されたコプロセッサ命令流の実行が完了すると、発行命令決定部105に対してコプロセッサ処理が完了したことを通知し、メインプロセッサは、メインプロセッサは当該通知を受け取ることで、コプロセッサの処理完了を検知してもよい。
 コプロセッサによるメモリアクセスの完了を当該コプロセッサの処理完了とみなしてもよい。例えば、コプロセッサの命令流内でメモリアクセスを使用した、データメモリに対するメモリアクセスが行われた場合、メモリへの読み出し又は書き込みアクセスの完了は、プロセッサ内の命令実行に対して遅延することがある。このような場合、メモリアクセスの完了をコプロセッサ処理の完了とすることで、例えば、意図しないメモリアクセスのアドレス一致による不具合を検出することが可能となる。
 (2)第1の実施の形態において、非デバッグモード動作時においても、コプロセッサ起動命令の後続のメインプロセッサ命令を、コプロセッサ起動命令と同時発行しないよう制約してもよい。これにより、デバッグモードにおけるメインプロセッサ内の命令単位の並列性を用いた動作と、コプロセッサ内の命令単位の並列性を用いた動作は、プログラマが最終的に意図したもの(非デバッグモード動作)と完全に一致させることができる。
 (3)上記第2実施の形態において、マルチプロセッサシステム1000は、out-of-order実行を許容するものであってもよい。
 この場合、プログラムカウンタと異なる順番で命令が実行されることが許されるため、次の通知されるべき処理依頼命令の後続命令であっても、当該次に通知されるべき処理依頼命令に依存が無い場合、当該後続命令を先に実行することが可能となる。
 (4)上記の実施の形態で説明した手法の手順を記述したプログラムをメモリに記憶しておき、CPU(Central Processing Unit)などがメモリからプログラムを読み出して、読み出したプログラムを実行することによって、上記の手法が実現されるようにしてもよい。
 また、当該手法の手順を記述したプログラムを記録媒体に格納して、頒布するようにしてもよい。
 (5)上記の実施の形態におけるマルチプロセッサシステムの各構成要素は、ハードウェア資源(プロセッサとメモリ上のプログラムとの協働)により実現される。
 (6)上記実施の形態及び変形例を組み合わせるとしてもよい。
 5.補足
 (1)本発明の一実施態様である、第1プロセッサと、当該第1プロセッサからの通知を受けて処理を実行する第2プロセッサとを有するマルチプロセッサシステムにおいて、前記第1プロセッサは、デバッグモードが設定されているか否かを判別する判別手段と、命令列中から実行対象となる命令を逐次特定する特定手段と、特定された命令が、処理依頼命令である場合には前記第2プロセッサに対して当該処理依頼に基づく通知を行い、処理依頼命令でない場合には当該特定された命令を実行する実行手段と、前記第2プロセッサが前記通知に応じた処理を完了したことを検知する検知手段とを備え、前記特定手段は、前記判別手段でデバッグモードが設定されていると判別される場合において、処理依頼命令を特定すると以降の命令の特定は停止し、前記完了が検知されると命令の特定を再開することを特徴とする。
 この構成によると、マルチプロセッサシステムは、前記判別手段でデバッグモードが設定されていると判別される場合において、処理依頼命令を特定すると以降の命令の特定は停止し、前記完了が検知されると命令の特定を再開する。これにより、マルチプロセッサは、処理依頼命令を特定後において、以降の命令の特定を停止することで、第2プロセッサが処理する命令と、処理依頼命令の特定後以降の命令とは並列に発行されないので、効率的にデバッグすることができる。
 (2)ここで、前記第2プロセッサは前記通知に応じた処理を実行中は、当該処理を実行中である旨を示す信号を前記第1プロセッサへ出力し、前記検知手段は、前記第2プロセッサから前記信号が出力されている間は、前記第2プロセッサが前記通知に応じた処理を実行中であると判断し、当該信号が出力されなくなると前記通知に応じた処理が完了したと判断するとしてもよい。
 この構成によると、マルチプロセッサシステムにおいて第1プロセッサは、第2プロセッサから出力される信号の有無により、第2プロセッサの動作の終了の完了を検知することができる。
 (3)ここで、前記通知に応じた処理の完了とは、前記第2プロセッサが前記通知に応じた処理を実行するための命令流に含まれる全てのメモリアクセス命令のメモリへのアクセスが完了したことであるとしてもよい。
 この構成によると、マルチプロセッサシステムは、メモリアクセスの完了を第2プロセッサ処理の完了とするので、例えば、意図しないメモリアクセスのアドレス一致による不具合を検出することができる。
 (4)ここで、前記判別手段は、さらに、前記デバッグモードとは別のデバッグモードが、前記デバッグモードに代わって設定されているか否かを判別し、前記判別手段で前記別のデバッグモードが設定されていると判別される場合、前記特定手段が前記処理依頼命令を特定すると、前記実行手段は前記検知手段により前記完了が検知されるまでの間に、前記第2プロセッサに対する次の処理依頼命令の出現までに存在する命令を実行、又は前記次の処理依頼命令の出現までに存在する命令及び前記次の処理依頼命令の後続に位置し、且つ前記次の処理依頼命令に依存しない命令を実行し、前記検知手段により前記完了が検知されると当該次の処理依頼命令に基づく通知を前記第2プロセッサに対して行うとしてもよい。
 この構成によると、マルチプロセッサシステムは、別のデバッグモードが設定されている場合には、第2プロセッサにおいて異なる処理依頼命令に基づく通知に対する処理を並列に行うことはない。これにより、第2プロセッサにおいて異なる処理依頼命令に基づく通知に対する処理の並列化を実行する前に、第1プロセッサと第2プロセッサとの並列処理のデバッグを行うことで、効率的に不具合を排除することができる。
 (5)ここで、前記第1プロセッサは、さらに、前記判別手段でデバッグモードが設定されていないと判別する場合において、前記特定手段に処理依頼命令を特定すると以降の命令の特定を停止させ、前記完了が検知されると命令の特定を再開するよう制御する制御手段を備えるとしてもよい。
 この構成によると、マルチプロセッサシステムは、デバッグモードが設定されていない場合においても、処理依頼命令を特定すると以降の命令の特定は停止し、前記完了が検知されると命令の特定を再開する。これにより、デバッグモードにおけるメインプロセッサ内の命令単位の並列性を用いた動作と、コプロセッサ内の命令単位の並列性を用いた動作は、非デバッグモードの動作と完全に一致させることができる。
 (6)ここで、前記第1プロセッサ及び前記第2プロセッサそれぞれで実行される命令は、画像のデコード処理を行うためのものであり、前記マルチプロセッサシステムは、画像のデコード処理を行う画像処理装置に備えられるとしてもよい。
 この構成によると、マルチプロセッサシステムは、デコード処理のデバッグを効率良く行うことができる。
 (8)ここで、前記第1プロセッサ及び前記第2プロセッサそれぞれで実行される命令は、画像のエンコード処理を行うためのものであり、前記マルチプロセッサシステムは、画像のエンコード処理を行う画像処理装置に備えられるとしてもよい。
 この構成によると、マルチプロセッサシステムは、エンコード処理のデバッグを効率良く行うことができる。
 本発明に係るマルチプロセッサシステムは、柔軟で高性能な演算処理を実現する機能を有するため、DVDレコーダやデジタルTV等の映像や音声のメディア処理を行うシステムLSI等に適用できる。
 10、1000  マルチプロセッサシステム
 11、1001  メインプロセッサ
 12、1002  コプロセッサ
 101  命令メモリ
 102  命令フェッチ制御部
 103  命令群決定部
 104  命令バッファ
 105、1105  発行命令決定部
 106  レジスタファイル
 107  演算器群
 108  メモリアクセス部
 109  データメモリ
 110  ライトバックバス
 111、1111  デバッグモード判別部
 121  命令処理部
 122  レジスタファイル
 123  演算器群
 124  メモリアクセス部
 125  データメモリ
 126  ライトバックバス
 201、1201  命令特定部
 202、1202  命令実行部
 203、1203  検知部

Claims (8)

  1.  第1プロセッサと、当該第1プロセッサからの通知を受けて処理を実行する第2プロセッサとを有するマルチプロセッサシステムであって、
     前記第1プロセッサは、
     デバッグモードが設定されているか否かを判別する判別手段と、
     命令列中から実行対象となる命令を逐次特定する特定手段と、
     特定された命令が、処理依頼命令である場合には前記第2プロセッサに対して当該処理依頼に基づく通知を行い、処理依頼命令でない場合には当該特定された命令を実行する実行手段と、
     前記第2プロセッサが前記通知に応じた処理を完了したことを検知する検知手段とを備え、
     前記特定手段は、前記判別手段でデバッグモードが設定されていると判別される場合において、処理依頼命令を特定すると以降の命令の特定は停止し、前記完了が検知されると命令の特定を再開する
     ことを特徴とするマルチプロセッサシステム。
  2.  前記第2プロセッサは前記通知に応じた処理を実行中は、当該処理を実行中である旨を示す信号を前記第1プロセッサへ出力し、
     前記検知手段は、前記第2プロセッサから前記信号が出力されている間は、前記第2プロセッサが前記通知に応じた処理を実行中であると判断し、当該信号が出力されなくなると前記通知に応じた処理が完了したと判断する
     ことを特徴とする請求項1に記載のマルチプロセッサシステム。
  3.  前記通知に応じた処理の完了とは、前記第2プロセッサが前記通知に応じた処理を実行するための命令流に含まれる全てのメモリアクセス命令のメモリへのアクセスが完了したことである
     ことを特徴とする請求項2に記載のマルチプロセッサシステム。
  4.  前記判別手段は、さらに、
     前記デバッグモードとは別のデバッグモードが、前記デバッグモードに代わって設定されているか否かを判別し、
     前記判別手段で前記別のデバッグモードが設定されていると判別される場合、前記特定手段が前記処理依頼命令を特定すると、前記実行手段は前記検知手段により前記完了が検知されるまでの間に、前記第2プロセッサに対する次の処理依頼命令の出現までに存在する命令を実行、又は前記次の処理依頼命令の出現までに存在する命令及び前記次の処理依頼命令の後続に位置し、且つ前記次の処理依頼命令に依存しない命令を実行し、前記検知手段により前記完了が検知されると当該次の処理依頼命令に基づく通知を前記第2プロセッサに対して行う
     ことを特徴とする請求項1に記載のマルチプロセッサシステム。
  5.  前記第1プロセッサは、さらに、
     前記判別手段でデバッグモードが設定されていないと判別する場合において、前記特定手段に処理依頼命令を特定すると以降の命令の特定を停止させ、前記完了が検知されると命令の特定を再開するよう制御する制御手段を備える
     ことを特徴とする請求項1に記載のマルチプロセッサシステム。
  6.  前記第1プロセッサ及び前記第2プロセッサそれぞれで実行される命令は、画像のデコード処理を行うためのものであり、
     前記マルチプロセッサシステムは、
     画像のデコード処理を行う画像処理装置に備えられる
     ことを特徴とする請求項1に記載のマルチプロセッサシステム。
  7.  前記第1プロセッサ及び前記第2プロセッサそれぞれで実行される命令は、画像のエンコード処理を行うためのものであり、
     前記マルチプロセッサシステムは、
     画像のエンコード処理を行う画像処理装置に備えられる
     ことを特徴とする請求項1に記載のマルチプロセッサシステム。
  8.  判別手段、特定手段、実行手段及び検知手段を備える第1プロセッサと、当該第1プロセッサからの通知を受けて処理を実行する第2プロセッサとを有するマルチプロセッサシステムで用いられる処理方法であって、
     前記判別手段が、デバッグモードが設定されているか否かを判別する判別ステップと、
     前記特定手段が、命令列中から実行対象となる命令を逐次特定する特定ステップと、
     前記実行手段が、特定された命令が処理依頼命令である場合には前記第2プロセッサに対して当該処理依頼に基づく通知を行い、処理依頼命令でない場合には当該特定された命令を実行する実行ステップと、
     前記検知手段が、前記第2プロセッサが前記通知に応じた処理を完了したことを検知する検知ステップとを含み、
     前記特定ステップは、前記判別ステップでデバッグモードが設定されていると判別される場合において、処理依頼命令を特定すると以降の命令の特定は停止し、前記完了が検知されると命令の特定を再開する
     ことを特徴とする処理方法。
PCT/JP2012/003704 2011-07-19 2012-06-06 マルチプロセッサシステム WO2013011620A1 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201280035369.5A CN103718158B (zh) 2011-07-19 2012-06-06 多处理器系统
US14/232,389 US9317287B2 (en) 2011-07-19 2012-06-06 Multiprocessor system

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2011158123 2011-07-19
JP2011-158123 2011-07-19

Publications (1)

Publication Number Publication Date
WO2013011620A1 true WO2013011620A1 (ja) 2013-01-24

Family

ID=47557824

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2012/003704 WO2013011620A1 (ja) 2011-07-19 2012-06-06 マルチプロセッサシステム

Country Status (4)

Country Link
US (1) US9317287B2 (ja)
JP (1) JPWO2013011620A1 (ja)
CN (1) CN103718158B (ja)
WO (1) WO2013011620A1 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10776115B2 (en) * 2015-09-19 2020-09-15 Microsoft Technology Licensing, Llc Debug support for block-based processor
CN116149603A (zh) * 2021-11-23 2023-05-23 广东跃昉科技有限公司 运算指令处理方法及系统、主处理器和协处理器

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0659908A (ja) * 1992-08-11 1994-03-04 Toshiba Corp プログラム実行装置
JPH11232135A (ja) * 1998-02-10 1999-08-27 Mitsubishi Electric Corp 半導体装置
JP2006293759A (ja) * 2005-04-12 2006-10-26 Fujitsu Ltd マルチコアモデルシミュレータ
WO2006123546A1 (ja) * 2005-05-20 2006-11-23 Sony Computer Entertainment Inc. グラフィックプロセッサ、情報処理装置
JP2007004364A (ja) * 2005-06-22 2007-01-11 Nec Electronics Corp デバッグシステム、デバッグ方法およびプログラム

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07113902B2 (ja) 1987-10-20 1995-12-06 富士通株式会社 並列処理デバッグ制御方法
US5361352A (en) 1989-11-27 1994-11-01 Hitachi, Ltd. Method for debugging in a parallel computer system and system for the same
JPH03218539A (ja) 1989-11-27 1991-09-26 Hitachi Ltd 並列計算機システムにおけるデバッグ方法
JP3481301B2 (ja) 1994-05-27 2003-12-22 富士通株式会社 プロセッサ制御装置
CN101231584A (zh) * 2007-01-23 2008-07-30 矽统科技股份有限公司 处理系统以及用以处理该处理系统中指令的相关方法
JP5891758B2 (ja) * 2011-12-06 2016-03-23 サンケン電気株式会社 電子装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0659908A (ja) * 1992-08-11 1994-03-04 Toshiba Corp プログラム実行装置
JPH11232135A (ja) * 1998-02-10 1999-08-27 Mitsubishi Electric Corp 半導体装置
JP2006293759A (ja) * 2005-04-12 2006-10-26 Fujitsu Ltd マルチコアモデルシミュレータ
WO2006123546A1 (ja) * 2005-05-20 2006-11-23 Sony Computer Entertainment Inc. グラフィックプロセッサ、情報処理装置
JP2007004364A (ja) * 2005-06-22 2007-01-11 Nec Electronics Corp デバッグシステム、デバッグ方法およびプログラム

Also Published As

Publication number Publication date
US20140136821A1 (en) 2014-05-15
CN103718158B (zh) 2016-10-19
JPWO2013011620A1 (ja) 2015-02-23
US9317287B2 (en) 2016-04-19
CN103718158A (zh) 2014-04-09

Similar Documents

Publication Publication Date Title
US9389863B2 (en) Processor that performs approximate computing instructions
US9195466B2 (en) Fusing conditional write instructions having opposite conditions in instruction processing circuits, and related processor systems, methods, and computer-readable media
JP5431308B2 (ja) システムおよびパイプラインプロセッサにおける条件命令実行の加速のためのローカル条件コードレジスタの使用方法
CN101178646B (zh) 多线程处理器
JP5379122B2 (ja) マルチプロセッサ
JP7118984B2 (ja) ロード命令のメモリ・アクセスを回避するためのコンピュータ実装方法、システム、およびコンピュータ・プログラム
JP2009053861A (ja) プログラム実行制御装置
US9213546B2 (en) Implementation of instruction for direct memory copy
US9588845B2 (en) Processor that recovers from excessive approximate computing error
CN110688160A (zh) 一种指令流水线处理方法、系统、设备及计算机存储介质
JP5853217B2 (ja) プロセッサ
WO2013011620A1 (ja) マルチプロセッサシステム
US20220035635A1 (en) Processor with multiple execution pipelines
KR100837400B1 (ko) 멀티스레딩/비순차 병합 기법에 따라 처리하는 방법 및장치
KR20090042283A (ko) 효율적 인터럽트 리턴 어드레스 저장 메커니즘
US11086626B2 (en) Circuitry and methods
KR20070118543A (ko) 재구성 어레이를 위한 멀티태스킹 방법 및 장치
JP5236386B2 (ja) 画像復号装置及び画像復号方法
TW559731B (en) Efficient emulation dispatch based on instruction width
US20110296143A1 (en) Pipeline processor and an equal model conservation method
CN117472443A (zh) 一种处理器调试系统中指令的处理方法和装置
Fang et al. Design and implementation of a videotext extractor on dual-core platform
WO2001077818A2 (en) Method for predicting the instruction execution latency of a de-coupled configurable co-processor
JPH1196105A (ja) プロセッサ
JPH11296378A (ja) プログラム作成方法および情報処理装置

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 12814275

Country of ref document: EP

Kind code of ref document: A1

ENP Entry into the national phase

Ref document number: 2013524581

Country of ref document: JP

Kind code of ref document: A

WWE Wipo information: entry into national phase

Ref document number: 14232389

Country of ref document: US

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 12814275

Country of ref document: EP

Kind code of ref document: A1