索引 A | B | C | D | E | F | G | H | I | K | L | M | N | O | P | R | S | T | U | V | W A abort() (vllm.AsyncLLMEngine 方法) abort_request() (vllm.LLMEngine 方法) add_lora() (vllm.AsyncLLMEngine 方法) add_request() (vllm.LLMEngine 方法) additional_data (vllm.PoolingParams 属性) apply() (vllm.multimodal.processing.BaseMultiModalProcessor 方法) (vllm.multimodal.processing.EncDecMultiModalProcessor 方法) apply_model() (vllm.LLM 方法) as_classification_model() (在模块 vllm.model_executor.models.adapters 中) as_embedding_model() (在模块 vllm.model_executor.models.adapters 中) as_reward_model() (在模块 vllm.model_executor.models.adapters 中) AsyncLLMEngine (在 vllm 中的类) AudioEmbeddingItems (在 vllm.multimodal.parse 中的类) AudioProcessorItems (在 vllm.multimodal.parse 中的类) B BaseDummyInputsBuilder (在 vllm.multimodal.profiling 中的类) BaseMultiModalProcessor (在 vllm.multimodal.processing 中的类) BaseProcessingInfo (在 vllm.multimodal.processing 中的类) batch() (vllm.multimodal.inputs.MultiModalKwargs 静态方法) batched() (vllm.multimodal.inputs.MultiModalFieldConfig 静态方法) beam_search() (vllm.LLM 方法) BoundPromptReplacement (在 vllm.multimodal.processing 中的类) C chat() (vllm.LLM 方法) check_health() (vllm.AsyncLLMEngine 方法) classify() (vllm.LLM 方法) clone() (vllm.PoolingParams 方法) (vllm.SamplingParams 方法) collective_rpc() (vllm.LLM 方法) compute_logits() (vllm.model_executor.models.interfaces_base.VllmModelForTextGeneration 方法) create_encoder_prompt() (vllm.multimodal.processing.EncDecMultiModalProcessor 方法) create_input_mapper() (vllm.multimodal.registry.MultiModalRegistry 方法) create_processor() (vllm.multimodal.registry.MultiModalRegistry 方法) D data (vllm.multimodal.inputs.MultiModalFieldElem 属性) DEPRECATE_INIT_POSARGS (vllm.LLM 属性) DEPRECATE_LEGACY (vllm.LLM 属性) DictEmbeddingItems (在 vllm.multimodal.parse 中的类) do_log_stats() (vllm.LLMEngine 方法) DO_VALIDATE_OUTPUT (vllm.LLMEngine 属性) DummyInputsBuilderFactory (在 vllm.multimodal.registry 中的类) E embed() (vllm.LLM 方法) EmbeddingItems (在 vllm.multimodal.parse 中的类) EncDecMultiModalProcessor (在 vllm.multimodal.processing 中的类) encode() (vllm.AsyncLLMEngine 方法) (vllm.LLM 方法) engine_step() (vllm.AsyncLLMEngine 方法) F features (vllm.multimodal.processing.PromptReplacementDetails 属性) field (vllm.multimodal.inputs.MultiModalFieldElem 属性) find_text_matches() (在模块 vllm.multimodal.processing 中) find_token_matches() (在模块 vllm.multimodal.processing 中) flat() (vllm.multimodal.inputs.MultiModalFieldConfig 静态方法) flat_from_sizes() (vllm.multimodal.inputs.MultiModalFieldConfig 静态方法) forward() (vllm.model_executor.models.interfaces.SupportsPP 方法) from_engine_args() (vllm.AsyncLLMEngine 类方法) (vllm.LLMEngine 类方法) from_items() (vllm.multimodal.inputs.MultiModalKwargs 静态方法) full (vllm.multimodal.processing.PromptReplacementDetails 属性) full_groupby_modality() (在模块 vllm.multimodal.processing 中) G generate() (vllm.AsyncLLMEngine 方法) (vllm.LLM 方法) get() (vllm.multimodal.parse.DictEmbeddingItems 方法) (vllm.multimodal.parse.EmbeddingItems 方法) (vllm.multimodal.parse.ModalityDataItems 方法) (vllm.multimodal.parse.ProcessorBatchItems 方法) get_all() (vllm.multimodal.parse.ModalityDataItems 方法) get_all_counts() (vllm.multimodal.parse.MultiModalDataItems 方法) get_count() (vllm.multimodal.parse.DictEmbeddingItems 方法) (vllm.multimodal.parse.EmbeddingItems 方法) (vllm.multimodal.parse.ModalityDataItems 方法) (vllm.multimodal.parse.MultiModalDataItems 方法) (vllm.multimodal.parse.ProcessorBatchItems 方法) get_decoding_config() (vllm.AsyncLLMEngine 方法) (vllm.LLMEngine 方法) get_dummy_processor_inputs() (vllm.multimodal.profiling.BaseDummyInputsBuilder 方法) get_hf_processor() (vllm.multimodal.processing.BaseProcessingInfo 方法) get_input_embeddings() (vllm.model_executor.models.interfaces.SupportsMultiModal 方法) get_input_preprocessor() (vllm.AsyncLLMEngine 方法) get_item() (vllm.multimodal.inputs.MultiModalKwargs 方法) get_item_count() (vllm.multimodal.inputs.MultiModalKwargs 方法) get_items() (vllm.multimodal.inputs.MultiModalKwargs 方法) (vllm.multimodal.parse.MultiModalDataItems 方法) get_lora_config() (vllm.AsyncLLMEngine 方法) (vllm.LLMEngine 方法) get_max_multimodal_tokens() (vllm.multimodal.registry.MultiModalRegistry 方法) get_max_tokens_by_modality() (vllm.multimodal.registry.MultiModalRegistry 方法) get_max_tokens_per_item_by_modality() (vllm.multimodal.registry.MultiModalRegistry 方法) get_max_tokens_per_item_by_nonzero_modality() (vllm.multimodal.registry.MultiModalRegistry 方法) get_mm_limits_per_prompt() (vllm.multimodal.registry.MultiModalRegistry 方法) get_mm_max_tokens_per_item() (vllm.multimodal.processing.BaseProcessingInfo 方法) get_model_config() (vllm.AsyncLLMEngine 方法) (vllm.LLMEngine 方法) get_multimodal_embeddings() (vllm.model_executor.models.interfaces.SupportsMultiModal 方法) get_num_unfinished_requests() (vllm.LLMEngine 方法) get_parallel_config() (vllm.AsyncLLMEngine 方法) (vllm.LLMEngine 方法) get_passthrough_data() (vllm.multimodal.parse.DictEmbeddingItems 方法) (vllm.multimodal.parse.EmbeddingItems 方法) (vllm.multimodal.parse.ModalityDataItems 方法) (vllm.multimodal.parse.ProcessorBatchItems 方法) get_processor_data() (vllm.multimodal.parse.DictEmbeddingItems 方法) (vllm.multimodal.parse.EmbeddingItems 方法) (vllm.multimodal.parse.ModalityDataItems 方法) (vllm.multimodal.parse.ProcessorBatchItems 方法) get_replacement() (vllm.multimodal.processing.BoundPromptReplacement 方法) get_scheduler_config() (vllm.AsyncLLMEngine 方法) (vllm.LLMEngine 方法) get_supported_mm_limits() (vllm.multimodal.processing.BaseProcessingInfo 方法) get_tokenizer() (vllm.AsyncLLMEngine 方法) H has_inner_state (vllm.model_executor.models.interfaces.HasInnerState 属性) has_processor() (vllm.multimodal.registry.MultiModalRegistry 方法) has_unfinished_requests() (vllm.LLMEngine 方法) has_unfinished_requests_for_virtual_engine() (vllm.LLMEngine 方法) HasInnerState (在 vllm.model_executor.models.interfaces 中的类) height (vllm.multimodal.parse.ImageSize 属性) I ImageEmbeddingItems (在 vllm.multimodal.parse 中的类) ImageProcessorItems (在 vllm.multimodal.parse 中的类) ImageSize (在 vllm.multimodal.parse 中的类) init_mm_limits_per_prompt() (vllm.multimodal.registry.MultiModalRegistry 方法) is_attention_free (vllm.model_executor.models.interfaces.IsAttentionFree 属性) is_hybrid (vllm.model_executor.models.interfaces.IsHybrid 属性) IsAttentionFree (在 vllm.model_executor.models.interfaces 中的类) IsHybrid (在 vllm.model_executor.models.interfaces 中的类) iter_token_matches() (在模块 vllm.multimodal.processing 中) K key (vllm.multimodal.inputs.MultiModalFieldElem 属性) L length (vllm.multimodal.inputs.PlaceholderRange 属性) LLM (在 vllm 中的类) LLMEngine (在 vllm 中的类) M make_empty_intermediate_tensors() (vllm.model_executor.models.interfaces.SupportsPP 方法) map_input() (vllm.multimodal.registry.MultiModalRegistry 方法) mm_hashes (vllm.multimodal.inputs.MultiModalInputs 属性) mm_kwargs (vllm.multimodal.inputs.MultiModalInputs 属性) mm_placeholders (vllm.multimodal.inputs.MultiModalInputs 属性) mm_processor_kwargs (vllm.inputs.TextPrompt 属性) (vllm.inputs.TokensPrompt 属性) modality (vllm.multimodal.inputs.MultiModalFieldElem 属性) (vllm.multimodal.processing.PromptReplacement 属性) ModalityDataItems (在 vllm.multimodal.parse 中的类) module vllm.engine vllm.model_executor.models.adapters vllm.model_executor.models.interfaces vllm.model_executor.models.interfaces_base vllm.multimodal.parse vllm.multimodal.processing vllm.multimodal.profiling vllm.multimodal.registry multi_modal_data (vllm.inputs.TextPrompt 属性) (vllm.inputs.TokensPrompt 属性) MULTIMODAL_REGISTRY (在模块 vllm.multimodal 中) MultiModalDataDict (在模块 vllm.multimodal.inputs 中) MultiModalDataItems (在 vllm.multimodal.parse 中的类) MultiModalDataParser (在 vllm.multimodal.parse 中的类) MultiModalFieldConfig (在 vllm.multimodal.inputs 中的类) MultiModalFieldElem (在 vllm.multimodal.inputs 中的类) MultiModalInputs (在 vllm.multimodal.inputs 中的类) MultiModalKwargs (在 vllm.multimodal.inputs 中的类) MultiModalKwargsItem (在 vllm.multimodal.inputs 中的类) MultiModalProcessorFactory (在 vllm.multimodal.registry 中的类) MultiModalProfiler (在 vllm.multimodal.profiling 中的类) MultiModalRegistry (在 vllm.multimodal.registry 中的类) N NestedTensors (在模块 vllm.multimodal.inputs 中) O offset (vllm.multimodal.inputs.PlaceholderRange 属性) P PlaceholderFeaturesInfo (在 vllm.multimodal.processing 中的类) PlaceholderRange (在 vllm.multimodal.inputs 中的类) pooler() (vllm.model_executor.models.interfaces_base.VllmModelForPooling 方法) PoolingParams (在 vllm 中的类) ProcessingInfoFactory (在 vllm.multimodal.registry 中的类) ProcessorBatchItems (在 vllm.multimodal.parse 中的类) ProcessorInputs (在 vllm.multimodal.profiling 中的类) prompt (vllm.inputs.TextPrompt 属性) (vllm.multimodal.inputs.MultiModalInputs 属性) prompt_token_ids (vllm.inputs.TokensPrompt 属性) (vllm.multimodal.inputs.MultiModalInputs 属性) PromptRepl (在模块 vllm.multimodal.processing 中) PromptReplacement (在 vllm.multimodal.processing 中的类) PromptReplacementDetails (在 vllm.multimodal.processing 中的类) PromptSeq (在模块 vllm.multimodal.processing 中) PromptType (在模块 vllm.inputs 中) R register_image_input_mapper() (vllm.multimodal.registry.MultiModalRegistry 方法) register_input_mapper() (vllm.multimodal.registry.MultiModalRegistry 方法) register_max_image_tokens() (vllm.multimodal.registry.MultiModalRegistry 方法) register_max_multimodal_tokens() (vllm.multimodal.registry.MultiModalRegistry 方法) register_plugin() (vllm.multimodal.registry.MultiModalRegistry 方法) register_processor() (vllm.multimodal.registry.MultiModalRegistry 方法) replace_text_matches() (在模块 vllm.multimodal.processing 中) replace_token_matches() (在模块 vllm.multimodal.processing 中) replacement (vllm.multimodal.processing.PromptReplacement 属性) reset_prefix_cache() (vllm.AsyncLLMEngine 方法) (vllm.LLMEngine 方法) run_engine_loop() (vllm.AsyncLLMEngine 静态方法) S sample() (vllm.model_executor.models.interfaces_base.VllmModelForTextGeneration 方法) SamplingParams (在 vllm 中的类) score() (vllm.LLM 方法) shared() (vllm.multimodal.inputs.MultiModalFieldConfig 静态方法) shutdown_background_loop() (vllm.AsyncLLMEngine 方法) sleep() (vllm.AsyncLLMEngine 方法) (vllm.LLM 方法) start_background_loop() (vllm.AsyncLLMEngine 方法) start_profile() (vllm.AsyncLLMEngine 方法) step() (vllm.LLMEngine 方法) stop_profile() (vllm.AsyncLLMEngine 方法) supports_lora (vllm.model_executor.models.interfaces.SupportsLoRA 属性) supports_multimodal (vllm.model_executor.models.interfaces.SupportsMultiModal 属性) supports_pp (vllm.model_executor.models.interfaces.SupportsPP 属性) SupportsCrossEncoding (在 vllm.model_executor.models.interfaces 中的类) SupportsLoRA (在 vllm.model_executor.models.interfaces 中的类) SupportsMultiModal (在 vllm.model_executor.models.interfaces 中的类) SupportsPP (在 vllm.model_executor.models.interfaces 中的类) SupportsQuant (在 vllm.model_executor.models.interfaces 中的类) SupportsTranscription (在 vllm.model_executor.models.interfaces 中的类) T target (vllm.multimodal.processing.BoundPromptReplacement 属性) (vllm.multimodal.processing.PromptReplacement 属性) TextPrompt (在 vllm.inputs 中的类) token_type_ids (vllm.inputs.TokensPrompt 属性) (vllm.multimodal.inputs.MultiModalInputs 属性) TokensPrompt (在 vllm.inputs 中的类) type (vllm.multimodal.inputs.MultiModalInputs 属性) U update_from_generation_config() (vllm.SamplingParams 方法) V VideoEmbeddingItems (在 vllm.multimodal.parse 中的类) VideoProcessorItems (在 vllm.multimodal.parse 中的类) vllm.engine module vllm.model_executor.models.adapters module vllm.model_executor.models.interfaces module vllm.model_executor.models.interfaces_base module vllm.multimodal.parse module vllm.multimodal.processing module vllm.multimodal.profiling module vllm.multimodal.registry module VllmModel (在 vllm.model_executor.models.interfaces_base 中的类) VllmModelForPooling (在 vllm.model_executor.models.interfaces_base 中的类) VllmModelForTextGeneration (在 vllm.model_executor.models.interfaces_base 中的类) W wake_up() (vllm.AsyncLLMEngine 方法) (vllm.LLM 方法) width (vllm.multimodal.parse.ImageSize 属性)